first()案例
作用:返回RDD中的第一个元素
需求:创建一个RDD,返回该RDD中的第一个元素
(1)创建一个RDD
scala> val rdd = sc.parallelize(1 to 10)
rdd: org.apache.spark.rdd.RDD[Int] = ParallelCollectionRDD[0] at parallelize at <console>:24
(2)统计该RDD的条数
scala> rdd.first
res2: Int = 1
take(n)案例
作用:返回一个由RDD的前n个元素组成的数组
需求:创建一个RDD,统计该RDD的条数
(1)创建一个RDD
scala> val rdd = sc.parallelize(Array(2,5,4,6,8,3))
rdd: org.apache.spark.rdd.RDD[Int] = ParallelCollectionRDD[2] at parallelize at <console>:24
(2)统计该RDD的条数
scala> rdd.take(3)
res10: Array[Int] = Array(2, 5, 4)
想要了解跟多关于大数据培训课程内容欢迎关注尚硅谷大数据培训,尚硅谷除了这些技术文章外还有免费的高质量大数据培训课程视频供广大学员下载学习。
上一篇: java培训技术返回JSON
下一篇: java培训之HttpMessageConverter原理