3.3.1 数据分析
数据的输入: HBase
数据的输出: Mysql
HBase 中数据表结构:
标签 | 举例&说明 | |
---|---|---|
rowkey | hashregion_call1_startTime_call2_duration_flag 例如: 0001_15837312345_2018-01-02 11:11:11_13766889900_2121_0 |
|
family | info |
|
call1 | 第一个手机号码 | |
call2 | 第二个手机号码 | |
startTime | 通话建立的时间,例如: 2018-01-02 11:11:11 |
|
duration | 通话时长(单位:秒) | |
flag | 标记call1是主叫还是被叫(call1的身份与call2的身份互斥) 0 主叫, 1 被叫 |
已知目标,那么需要结合目标思考已有数据是否能够支撑目标实现;
根据目标数据结构,构建 Mysql 表结构,建表;
思考代码需要涉及到哪些功能模块,建立不同功能模块对应的包结构。
描述数据,一定是基于某个维度(视角)的,所以构建维度类。比如按照“年”与“手机号码”的组合作为 key 聚合所有的数据,便可以统计这个手机号码,这一年的相关结果。
自定义
OutputFormat
用于对接 Mysql,使数据输出。创建相关工具类。