10.6 使用 IDEA 创建 SparkSQL 程序

步骤1: 添加 SparkSQL 依赖

<dependency>
    <groupId>org.apache.spark</groupId>
    <artifactId>spark-sql_2.11</artifactId>
    <version>2.1.1</version>
</dependency>

步骤2: 具体代码


package day05

object DataFrameDemo {
    def main(args: Array[String]): Unit = {
        // 创建一个新的 SparkSession 对象
        val spark: SparkSession = SparkSession.builder()
            .master("local[*]")
            .appName("Word Count")
            .getOrCreate()
        // 导入用到隐式转换.  如果想要使用: $"age" 则必须导入
        val df = spark.read.json("file://" + ClassLoader.getSystemResource("user.json").getPath)
        // 打印信息
        df.show
        // 查找年龄大于19岁的
        df.filter($"age" > 19).show

        // 创建临时表
        df.createTempView("user")
        spark.sql("select * from user where age > 19").show

        //关闭连接
        spark.stop()

    }
}
Copyright © 尚硅谷大数据 2019 all right reserved,powered by Gitbook
该文件最后修订时间: 2019-08-09 00:21:43

results matching ""

    No results matching ""