2.3.3 在 Standalone 模式下启动 Spark-shell
bin/spark-shell \
--master spark://hadoop201:7077
说明:
--master spark://hadoop201:7077
指定要连接的集群的master
执行wordcount
程序
sc.textFile("input/").flatMap(_.split(" ")).map((_,1)).reduceByKey(_+_).collect
res4: Array[(String, Int)] = Array((are,2), (how,2), (hello,4), (atguigu,2), (world,2), (you,2))
注意:
- 每个
worker
节点上要有相同的文件夹:input/
, 否则会报文件不存在的异常