3.3.1 数据分析

数据的输入: HBase

数据的输出: Mysql

HBase 中数据表结构:

标签 举例&说明
rowkey hashregion_call1_startTime_call2_duration_flag例如: 0001_15837312345_2018-01-02 11:11:11_13766889900_2121_0
family info
call1 第一个手机号码
call2 第二个手机号码
startTime 通话建立的时间,例如: 2018-01-02 11:11:11
duration 通话时长(单位:秒)
flag 标记call1是主叫还是被叫(call1的身份与call2的身份互斥) 0 主叫, 1 被叫
  • 已知目标,那么需要结合目标思考已有数据是否能够支撑目标实现;

  • 根据目标数据结构,构建 Mysql 表结构,建表;

  • 思考代码需要涉及到哪些功能模块,建立不同功能模块对应的包结构。

  • 描述数据,一定是基于某个维度(视角)的,所以构建维度类。比如按照“年”与“手机号码”的组合作为 key 聚合所有的数据,便可以统计这个手机号码,这一年的相关结果。

  • 自定义 OutputFormat 用于对接 Mysql,使数据输出。

  • 创建相关工具类。

Copyright © 尚硅谷大数据 2019 all right reserved,powered by Gitbook
该文件最后修订时间: 2019-01-14 05:27:28

results matching ""

    No results matching ""