第 5 章 使用 Spark Streaming 搭建实时处理模块

什么叫日活:

  1. 通常: 打开应用的用户即为活跃用户,不考虑用户的使用情况。每天一台设备打开多次会被计为一个活跃用户。 也就是只需要统计第一次打开即可

  2. 游戏用户: 每天打开/登录游戏的用户数(针对游戏DAU的定义)

我们采用第一种日活的定义, 日活(DAU)统计思路:

  1. 从 kafka 读取用户启动日志

  2. 当天只保留用户的第一次启动记录, 过滤掉其他启动记录: 借助于 Redis

  3. 然后把第一次启动记录保存在 ES, 以供其他应用查询

Copyright © 尚硅谷大数据 2019 all right reserved,powered by Gitbook
该文件最后修订时间: 2019-10-08 23:56:19

results matching ""

    No results matching ""