Hive是大数据中一项重要的工具技术,无论是研读源码,还是建立一个匹配自有环境的Hive安装包,掌握Hive的源码编译技术都很重要。
本套教程以搭建Hive on Spark环境为主线,一步步演示Hive源码的编译过程,对编译过程中会遇到的诸多问题进行了详细解读,包括解决组件兼容性问题的示例、修复已知Bug的示例等。同时,教程还讲解了多种Hive使用场景的部署过程,并对Hive与Spark的版本兼容性问题进行了调研,是Hive使用的精细“说明书”。
教程学习需要对Hadoop、Hive、Spark等大数据框架有一定的了解,需要能够熟练使用Git/GitHub及Maven。