1.1 Kylin 特点

大数据 OLAP 的两个事实:

  1. 大数据查询要的一般是统计结果,是多条记录经过聚合函数计算后的统计值。原始的记录则不是必需的,或者访问频率和概率都极低。

  2. 聚合是按维度进行的,由于业务范围和分析需求是有限的,有意义的维度聚合组合也是相对有限的,一般不会随着数据的膨胀而增长。

Kylin 基于以上两点,得到一个新的思路——预计算。应尽量多地预先计算聚合结果,在查询时刻应尽量使用预算的结果得出查询结果,从而避免直接扫描可能无限增长的原始记录。

Kylin特点

Kylin 的主要特点包括支持 SQL 接口、支持超大规模数据集、亚秒级响应、可伸缩性、高吞吐率、BI 工具集成等

  • 可扩展超快 OLAP 引擎 Kylin是为减少在 Hadoop/Spark 上百亿规模数据查询延迟而设计

    On-Line Analytical Processing,简称OLAP

  • Hadoop ANSI SQL 接口 Kylin为Hadoop提供标准SQL支持大部分查询功能

  • 交互式查询能力 通过 Kylin,用户可以与 Hadoop 数据进行亚秒级交互,在同样的数据集上提供比Hive 更好的性能

  • 多维立方体(MOLAP Cube) 用户能够在 Kylin 里为百亿以上数据集定义数据模型并构建立方体

  • 与 BI 工具无缝整合 Kylin 提供与 BI 工具的整合能力,如 Tableau,PowerBI/Excel,MSTR,QlikSense,Hue 和 SuperSet

    BI: Business intelligence 商业智能

Copyright © 尚硅谷大数据 2019 all right reserved,powered by Gitbook
该文件最后修订时间: 2019-04-02 05:47:19

results matching ""

    No results matching ""