本章介绍SparkSQL 的各种数据源(Data Sources).
Spark SQL 的DataFrame接口支持操作多种数据源. 一个 DataFrame类型的对象可以像 RDD 那样操作(比如各种转换), 也可以用来创建临时表.
DataFrame
RDD
把DataFrame注册为一个临时表之后, 就可以在它的数据上面执行 SQL 查询.