如何做好一份大数据分析报告-柠檬科技讲解
1、洞察运营商数据
如何去分析运营商的数据,数据有那些,用户信息和行为数据等是什么,如何给她们添加标签。

2、移动互联网时代下,我们时刻被数据包围着,通过数据分析,我们可以洞察用户行为,了解市场发展趋势

3、了解数据的原始面貌,常用基础信息表

4、数据处理
(1)数据获取
1、用户属性数据
基于虚拟HLR、综分系统获取,如:
用户、性别、年龄、归属地、终端、ARPU、流量
2、用户位置数据
基于实时人流系统、S1-MME,如:
时间、用户、小区基站、经纬度
3、用户行为数据
基于4G话单S1U-HTTP获取,如:
时间、用户、应用、操作、关键字、位置等

5、(2)数据清洗
1、缺失数据处理
部分数据缺失,如用户年龄数据不完整,应进行过滤。
2、噪声数据处理
数据采集或获取时存误,应针对具体情况进行修正。
3、重复数据处理
统计一定周期内,用户行为可能出现重复,需进行过滤

6、(3)数据整理
数据匹配对不同来源的数据按时间、用户等规则进行匹配,使数据标准化。

7、数据分析
描述性分析
描述分析是对数据进行基本情况的刻画,包括数据总数、时间跨度、空间分布、用户分布和产品分布等内容。
常用分析方法:变化、分布、对比、预测
建模分析
面对较复杂的统计问题时,需要针对场景搭建分析模型,找到蕴藏在数据下面的客观规律。
例1:广东国庆出游分析。基于用户的位置数据分析广州用户出行方式。
1、确定目标用户。统计离粤用户归属地为广州,且28号仍在广州的用户。
2、获取用户位置数据。根据其发生通信行为的234G小区列表。
3、匹配交通方式。根据小区列表的位置匹配交通方式,划分为飞机场、火车站、高铁站、汽车站。
4、制定判断策略。按优先级划分区域,多天出现取最后一天,无记录用户记为自驾。
例2:广州道路拥堵分析。基于用户的位置数据分析道路拥堵情况。
1、获取动态用户。剔除室内小区,用户工作和生活常驻区域
2、筛选黄埔大道用户。筛选经过黄埔大道两侧的用户,根据时间判断其行进方向。
3、统计道路平均速度。筛选用户在黄埔大道切换最多的两个小区,统计距离和耗时,计算平均速度。

8、可视化展现
工具: PPT、EXCEL、WORD

9、可视化展现
工具:JS、R、H5
