JSON文件
Spark SQL 能够自动推测 JSON数据集的结构,并将它加载为一个Dataset[Row]. 可以通过SparkSession.read.json()去加载一个 一个JSON 文件。
注意:这个JSON文件不是一个传统的JSON文件,每一行都得是一个JSON串。格式如下:
{“name”:”Michael”}
{“name”:”Andy”, “age”:30}
{“name”:”Justin”, “age”:19}
1)导入隐式转换
import spark.implicits._
2)加载JSON文件
val path = “examples/src/main/resources/people.json”
val peopleDF = spark.read.json(path)
3)创建临时表
peopleDF.createOrReplaceTempView(“people”)
4)数据查询
想要了解跟多关于大数据培训课程内容欢迎关注尚硅谷大数据培训,尚硅谷除了这些技术文章外还有免费的高质量大数据培训课程视频供广大学员下载学习。
上一篇: 用户自定义函数_大数据培训
下一篇: 嵌套函数中的 this 不会从外层函数中继承_前端培训