1 Reduce Join
Reduce Join工作原理
Map端的主要工作:为来自不同表或文件的key/value对,打标签以区别不同
来源的记录。然后用连接字段作为key,其余部分和新加的标志作为valuie,最后
进行输出。
Reduce端的主要工作:在Reduce端以连接字段作为key的分组已经完成,我
们只需要在每一个分组当中将那些来源于不同文件的记录(在Map阶段已经打标
志)分开,最后进行合并就ok了。

想要了解跟多关于大数据培训课程内容欢迎关注尚硅谷大数据培训,尚硅谷除了这些技术文章外还有免费的高质量大数据培训课程视频供广大学员下载学习
上一篇: 大数据培训课程自定义OutputFormat案例实操
下一篇: java培训教程bean之间的依赖