collect()案例
作用:在驱动程序中,以数组的形式返回数据集的所有元素。
需求:创建一个RDD,并将RDD内容收集到Driver端打印
(1)创建一个RDD
scala> val rdd = sc.parallelize(1 to 10)
rdd: org.apache.spark.rdd.RDD[Int] = ParallelCollectionRDD[0] at parallelize at <console>:24
(2)将结果收集到Driver端
scala> rdd.collect
res0: Array[Int] = Array(1, 2, 3, 4, 5, 6, 7, 8, 9, 10)
count()案例
作用:返回RDD中元素的个数
需求:创建一个RDD,统计该RDD的条数
(1)创建一个RDD
scala> val rdd = sc.parallelize(1 to 10)
rdd: org.apache.spark.rdd.RDD[Int] = ParallelCollectionRDD[0] at parallelize at <console>:24
(2)统计该RDD的条数
scala> rdd.count
res1: Long = 10
想要了解跟多关于大数据培训课程内容欢迎关注尚硅谷大数据培训,尚硅谷除了这些技术文章外还有免费的高质量大数据培训课程视频供广大学员下载学习。
上一篇: java培训之SpringMVC提示消息的国际化
下一篇: java培训技术返回JSON