强强联手 | 尚硅谷Kylin新版视频教程发布

Apache Kylin是一个开源的分布式分析引擎,为大数据开发人员提供Hadoop/Spark之上的SQL查询接口,以及支持超大规模数据集的多维分析能力,在大数据领域有着广泛的应用,是大数据开发人员的必备技能之一。

本套视频教程由Apache Kylin的开发团队与尚硅谷联合研发推出,对尚硅谷原Kylin教程进行了全面升级。Kylin版本升级为4.0,涵盖了Kylin新版的重大功能升级,并将构建引擎和查询引擎全部升级为Spark,将存储由HBase升级为HDFS下的Parquet存储,这三方面的升级大大提升了Kylin的Cube构建效率和查询效率。

教程详细讲解了Kylin 4.0的安装部署过程,与其他框架的版本兼容性也进行了充分调研,并基于真实数据案例进行了实操演示。

除此之外,教程中增加了由Kylin官方推荐使用的MDX for Kylin。MDX for Kylin是基于Mondrian二次开发,使用Apache Kylin作为数据源的MDX查询引擎,可以集成多种数据分析工具,提供在大数据分析场景下更极致的体验。教程基于真实数据,提供了详尽的安装、配置和使用讲解。

本次教程升级遵循原版视频的理念,从前置基本概念入手,深入Kylin底层架构,详解Cube构建算法,在实际应用层面多角度讲解常用优化手段。教程提供全套视频、代码、笔记和资料,一套教程带你搞定Kylin!

教程详细目录:

01.教程简介
02.理论概述-前置概念
03.理论概述-架构介绍
04.理论概述-特点和4.0的升级
05.安装启动-安装和部署
06.安装启动-启动环境准备
07.安装启动-启动和关闭
08.入门实战-准备数据&创建工程&对接数据源
09.入门实战-创建Model
10.入门实战-创建&构建Cube
11.入门实战-Kylin和Hive性能对比
12.入门实战-Kylin使用注意事项
13.入门实战-实现每日自动构建Cube
14.入门实战-Kylin设置查询下压
15.查询引擎-Sparder介绍
16.构建优化-衍生维度
17.构建优化-聚合组
18.构建优化-设置合适的Spark参数调优
19.构建优化-全局字典和维度快照表调优
20.查询优化-RowKey排序和设置Shardby分区列
21.查询优化-Parquet文件重分区参数调整
22.BI工具-JDBC连接Kylin
23.BI工具-Zeppelin连接Kylin
24.MDX-安装&启动&登录
25.MDX-Excel对接MDX进行数据分析