大数据培训班_大数据培训课程_大数据培训机构-尚硅谷

重塑大数据课程新范式

尚硅谷与腾讯云、Apache等技术企业深度合作
打造AI时代的新型大数据课程

“尚硅谷一直以高质量的教学内容在技术圈广为传播, 并且积极拥抱当前火热的技术, 对开源保持密切关注和支持，深受广大开发者喜爱！腾讯云弹性MapReduce(EMR)是云上开源、开放的、云原生的大数据基础分析产品，旨在助力企业客户在云上方便、快捷以低成本的方式构建云上大数据分析基础平台、EMR在开源的基础上解决了安全、组件稳定、兼容问题的同时提供了开源软件驾驶舱的能力，以便企业客户更好地在云上使用开源大数据组件并协助开源社区健康发展。”

——腾讯云大数据EMR研发负责人陈龙

“作为全球数据库和大数据领域最为活跃的开源项目之一，Apache Doris 已受到了越来越多用户和开发者的关注。尚硅谷出品的 Doris 系列课程对于想深度了解 Apache Doris 的大数据工程师而言无疑是个福音，由浅入深，详尽剖析了系统原理，并且理论结合实践、从实际项目的角度帮助大家可以更好掌握 Apache Doris 使用技巧。期待未来有更多工程师在尚硅谷课程的帮助下，帮助国人打造的优秀开源项目在全球舞台继续发光发热！”

——Apache Doris PMC 张家锋

“尚硅谷的教学视频让许多学习者能够快速地了解和掌握开源项目的整体框架。你们的努力为开源社区的发展和壮大奠定了基础，让更多的人能够在开源世界中成长和进步。”

——Apache Seatunnel PMC 、Apache DolphinScheduler PMC、白鲸开源COO 聂励峰

“尚硅谷一直以高质量的教学内容在技术圈广为传播, 并且积极拥抱当前火热的技术, 对开源保持密切关注和支持，深受广大开发者喜爱！Apache StreamPark 是一个流计算开发管理平台, 旨在让流处理更简单, 社区发展日渐壮大，有着广泛的用户群体, 非常期待和尚硅谷再次合作, 共同打造高质量的课程, 让企业和开发者们受益。”

——Founder of Apache StreamPark 王华杰

“尚硅谷的课程不仅帮助各行业的开发人员快速学习并掌握核心技术，也同时为各开源项目提供手把手教学视频，使用户可以快速上手并在生产环境应用，推动了开源社区的发展，并让天下再无难学的技术。”

——Dinky PMC 亓文凯

电商离线数仓
电商Flink实时数仓
在线教育
在线听书
新能源汽车
广告营销
金融审批
医疗问诊
腾讯云EMR物流
阿里云MaxCompute
湖仓一体
技术中台
用户画像
推荐系统
Spark实时
彩票项目
保险项目
统一数仓项目

项目特色

依托国内电商巨头的实际业务场景，引入海量的真实点击数据和业务数据，紧跟大数据主流技术需求，配备AI辅助开发技巧详解，拥有丰富的数据仓库功能模块。

学习目标

全面了解数据仓库建模理论
充分熟悉电商行业数据分析指标体系
快速掌握多种大数据技术框架
了解认识多种数据仓库技术模块、掌握AI辅助开发技巧

主要技术栈

Hadoop Flume DataX Maxwell Kafka Spark DolphinScheduler SpringBoot Echart SuperSet Kylin Presto Ranger

查看项目架构

项目特色

参考众多大厂的实时数仓项目的经典架构研发推出，采用当前主流的实时数据流处理框架Flink作为主要计算引擎，涉及多种实时计算关键技术，新增AI辅助开发技巧的讲解，全面满足企业对实时开发的要求。

学习目标

了解实时数据仓库的建模理论
灵活应用Flink的流式计算技术，多种技术框架协调配合
灵活应用AI，提升开发效率
优化项目代码，融汇贯通整个大数据开发的关键技术

主要技术栈

Flume Maxwell Kafka Flink HBase Phoenix Redis ClickHouse SpringBoot SugarBI

查看项目架构

项目特色

基于在线教育行业的实际业务场景，引入海量的真实点击数据和业务数据，紧跟大数据的主流技术需求，穿插AI辅助开发技巧讲解，搭建了一整套完整的离线数据仓库和实时数据仓库。

学习目标

充分了解在线教育行业的业务数据体系，熟悉在线教育行业的离线指标体系
熟悉在线教育行业的实时指标体系，充分掌握多种大数据技术框架的协调应用，充分掌握AI辅助开发技巧

主要技术栈

Hadoop Flume DataX Maxwell Kafka Spark DolphinScheduler SpringBoot Echarts SuperSet Kylin Presto Ranger Flink HBase Phoenix Redis Doris SugarBI

查看项目架构

项目特色

涵盖了大数据的数仓建模理论、数据处理技术手段和大数据平台搭建方法，依托真实在线听书行业的实际业务场景，展示全面的离线与实时的指标体系，配备AI辅助开发技巧详解。

学习目标

充分了解在线听书行业的业务数据体系，熟悉在线听书行业的离线指标体系
熟悉在线听书行业的实时指标体系，充分掌握多种大数据技术框架的协调应用，充分掌握AI辅助开发技巧

主要技术栈

Hadoop Flume Kafka Maxwell DataX Hive Spark Flink SugarBI ClickHouse Redis HBase Phoenix DolphinScheduler

查看项目架构

项目特色

站在汽车物联网数据仓库的技术前列，依托真实汽车传感器数据，展示完整的离线指标体系，搭建功能完善的离线数据仓库，熟练应用大数据技术框架。

学习目标

充分了解汽车物联网行业的业务数据体系
熟悉汽车物联网行业的离线指标体系
充分掌握多种大数据技术框架的协调应用
掌握AI辅助开发技巧

主要技术栈

Hadoop Flume Kafka Maxwell DataX Hive Spark DolphinScheduler

查看项目架构

项目特色

依托真实广告行业的实际业务场景，透彻讲解互联网广告发展历程和广告完整运营流程，展示全面的广告指标体系，学习数据分析工具，配备AI辅助开发技巧详解。

学习目标

全面了解数据仓库建模理论
充分熟悉广告行业运营流程、专业术语和数据分析指标体系
彻底掌握多种大数据技术框架
掌握AI辅助开发技巧

主要技术栈

Hadoop Flume DataX Kafka Hive Spark DolphinScheduler ClickHouse FineBI

查看项目架构

项目特色

依托真实的金融审批行业的海量业务数据，构建离线数据仓库，依据数仓建模理论完成数据的存储、分析与调取，分析实现整套金融审批指标体系，构建指标分析仪表盘。

学习目标

充分了解金融审批行业的业务数据体系
熟悉金融审批行业的离线指标体系
充分掌握多种大数据技术框架的协调应用
掌握AI辅助开发技巧

主要技术栈

Hadoop Flume Kafka Maxwell DataX Hive Spark DolphinScheduler SuperSet

查看项目架构

项目特色

依托真实的医疗问诊行业的海量业务数据，构建离线数据仓库，依据数仓建模理论完成数据的存储、分析与调取，分析实现整套医疗问诊指标体系，构建指标分析仪表盘。

学习目标

充分了解医疗问诊行业的业务数据体系
熟悉医疗问诊行业的离线指标体系
充分掌握多种大数据技术框架的协调应用
掌握AI辅助开发技巧

主要技术栈

Hadoop Flume Kafka Maxwell DataX Hive Spark DolphinScheduler SuperSet

查看项目架构

项目特色

依托物流行业的真实业务场景，基于目前各大互联网企业对于腾讯云EMR架构体系的需求，将整个电商的数据仓库体系搭建在腾讯云架构上。课程中穿插对AI辅助开发技巧详细讲解，令AI真正赋能大数据开发。

学习目标

掌握腾讯云常用大数据技术框架的使用、选型和购买
掌握基于腾讯云EMR进行离线数据仓库和利用EMR进行实时数据仓库的搭建
充分掌握AI辅助开发技巧

主要技术栈

腾讯云EMR中的Hive Spark Hadoop Flink Flume Kafka

查看项目架构

项目特色

依托国内电商巨头的真实业务场景，基于目前各大互联网企业对于阿里云架构体系的需求，将整个电商的数据仓库体系搭建在阿里云架构上，做到全项目全流程上云。

学习目标

掌握阿里云常用大数据技术框架
掌握基于阿里云服务器进行离线数据仓库和实时数据仓库的搭建

主要技术栈

Flume RDS DataHub DataWorks DataV QuickBI Flink MaxCompute

查看项目架构

项目特色

该项目是一个完整可落地的湖仓一体项目，依托真实电商行业的海量数据集，充分利用Hudi，将数据湖概念与数仓建模理论融汇贯通，将Hudi与其他主要大数据框架充分集成。

学习目标

充分了解数据湖与数据仓库的概念区别
熟悉数据湖的构建开发流程
充分掌握Hudi与多种大数据框架的协调应用

主要技术栈

Flink Hudi Hadoop Flume Kafka FlinkCDC Hive Superset

查看项目架构

项目特色

一站式搞定数据治理、血缘管理、元数据管理、数据质量监控、批处理和实时处理的可视化调度、可视化即席查询、可视化数据采集配置。

学习目标

掌握技术中台中的核心功能开发原理
掌握大数据、JavaEE和前端技术的融合

主要技术栈

SpringBoot Vue ClickHouse Presto Spark Hive Flink DolphinScheduler

查看项目架构

项目特色

着眼于用数字化的标签描述用户个性特征、勾画目标用户，实现了从标签定义、标签任务处理、任务调度、任务监控、用户分区、用户洞察的全功能平台化管理。

学习目标

充分理解用户画像管理平台的搭建及使用
了解用户画像系统的设计思路
掌握标签的设计流程及应用
初步了解机器学习算法

主要技术栈

Spark MLib ClickHouse Redis Vue SpringBoot MyBatis

查看项目架构

项目特色

依托于真实的中文亚马逊电商数据集，以及真实的电商企业业务数据体系，构建了符合教学体系的一体化电商推荐系统，充分理解推荐系统的运作流程，拓宽技术视野。

学习目标

系统性梳理整合大数据技术知识与机器学习相关知识
深入了解推荐系统在电商企业中的实际应用
深入学习并掌握多种推荐算法

主要技术栈

Flume Kafka MongoDB Spark Streaming ElasticSearch Git Redis

查看项目架构

项目特色

依托企业级真实的实时数据分析环境，对目前互联网大厂中常见的实时分析场景提出了一套基于SparkStreaming的全面实用的技术解决方案，丰富实时技术栈。

学习目标

全面掌握Scala语言开发Spark的实时计算任务的开发技巧
了解使用不同的CDC框架，提升实时方向的项目开发经验

主要技术栈

Flume Canal Maxwell Kafka SparkStreaming HBase Phoenix Redis ElasticSearch Kibana SpringBoot SugarBI

查看项目架构

项目特色

依托真实的彩票行业的海量业务数据，构建离线数据仓库，依据数仓建模理论完成数据的存储、分析与调取，分析实现整套彩票指标体系，构建指标分析仪表盘。

学习目标

充分了解彩票行业的业务数据体系
熟悉彩票行业的离线指标体系
充分掌握多种大数据技术框架的协调应用
掌握AI辅助开发技巧

主要技术栈

Hadoop Flume Kafka Maxwell DataX Hive Spark DolphinScheduler SuperSet

查看项目架构

项目特色

依托真实的保险行业的海量业务数据，构建离线数据仓库，依据数仓建模理论完成数据的存储、分析与调取，分析实现整套保险指标体系，构建指标分析仪表盘。

学习目标

充分了解保险行业的业务数据体系
熟悉保险行业的离线指标体系
充分掌握多种大数据技术框架的协调应用
掌握AI辅助开发技巧

主要技术栈

Hadoop Flume Kafka Maxwell DataX Hive Spark DolphinScheduler SuperSet

查看项目架构

项目特色

该项目是一个完整可落地的统一数仓项目，依托真实电商行业的海量数据集，充分利用Doris，将Doris概念与数仓建模理论融汇贯通，将Doris与其他主要大数据框架充分集成。

学习目标

充分了解统一数仓与数据仓库的区别
熟悉统一数仓的构建开发流程
充分掌握Doris与多种大数据框架的协调应用

主要技术栈

Flink Doris SeaTunnel DolphinScheduler FineBI

查看项目架构

全程护航，你们只管乘风破浪

从入学到就业后，尚硅谷始终在你身边，助力学员整个职业生涯持续提升！一站式服务模式，用更高的效率，
更科学化的方法，提供长期就业辅导、推荐和技术支持

不同于目前培训机构普遍采用的测试方式，我们对基础没有硬性要求，我们不会用提高技术门槛的方法来降低自己培训压力与风险，只要你是有志青年、有学习潜力、热爱编程，尚硅谷就愿意为你提供学习平台，助你成才。
根据每个学员具体情况制定预习方案，帮你提前进入状态。
技术老师、辅导老师、班主任全程贯穿
技术学习+项目实战+学习效果测评+辅导答疑+生活帮助
就业老师1v1面试指导
职业素养课+简历指导+模拟面试+面试
毕业后仍可按需学习，免费充电，持续提升
扶上马，再送一程，帮助学员解决工作中的问题。