尚硅谷大数据就业捷报频传

以下仅是往期毕业学员展示,并非保证,学员以后的薪资水平应结合自身学习情况、未来就业机会等多重因素共同决定。

以上统计的,仅是学员毕业后首份工作的基本薪资,且不包含绩效、奖金、补助等各项福利。
点击查看,连续8期全部就业名单>>

部分学员就业喜报

以下仅是往期毕业学员展示,并非保证,学员以后的薪资水平应结合自身学习情况、未来就业机会等多重因素共同决定。
大数据培训 大数据培训班 大数据培训机构 大数据培训学习 大数据培训课程 大数据培训机构 大数据培训学习 大数据培训班 大数据培训课程 大数据培训机构

追求“极课”精神,探索教育黑科技

每期班课程都在更新迭代,所授技术与企业需求无缝对接,对标BAT等一线大厂

大数据企业的商业项目直接为学员所用,一线大牛工程师亲自指导实战开发
业务覆盖电商、在线教育、旅游、新闻、智慧城市等主流行业,全程贯穿项目实战
覆盖前沿技术:Hadoop,Spark,Flink,实时数据处理、离线数据处理、机器学习
尚硅谷大咖讲师+企业导师联合授课,培养中国更“出彩”的大数据工程师

就业选择多,薪资增长快,未来发展不可限量

大数据研发
大数据开发
大数据开发
大数据开发

大牛引路,实战贯穿!

大数据企业的商业项目直接为学员所用,一线大牛工程师亲自指导实战开发

大数据项目谷粒电信

项目名称 实时数据处理

项目简介 对于实时性要求高的应用,如用户即时详单查询,业务量监控等,需要应用实时处理架构

项目架构 Nginx + SpringBoot + MySql + Flume + Kafka + SparkStreaming + Canal HA + Redis + ElasticSearch + Hbase + Tomcat + Echart + maxwell

项目场景 对于实时要求高的应用、有对数据进行实时展示和查询需求时

项目技术 分别使用canal和kafka搭建各自针对业务数据库和用户行为数据的实时数据采集系统,使用SparkStreaming搭建高吞吐的数据实时处理模块,选用ES作为最终的实时数据处理结果的存储位置,并从中获取数据进行展示,进一步降低响应时间

项目特色 针对不同数据来源的实时数据处理制定相应方案,能广泛适配大部分企业的实时处理系统

大数据项目谷粒城市

项目名称 尚硅谷风险控制

项目简介 使用Flink框架计算各种电商网站指标,如滑动窗口TopN,日志流量统计。使用Flink框架做风控,例如监控订单失效、恶意登录等需求。

项目架构 Flume + Kafka + Flink + Elasticsearch + Kibana

项目场景 电商各类指标实时计算,风险实时监控

项目技术 Flink DataStream各种算子的使用,Flink Low Level API的使用,Flink CEP复杂事件处理库的使用,Flink的流批处理功能

项目特色 这个项目的特色在于如何使用Flink解决对实时性要求非常高的场景,也就是说通过项目来学习Flink的杀手级应用场景,而非解决Spark,Storm框架等已经解决的问题。

大数据项目谷粒医疗

项目名称 尚硅谷数据采集

项目简介 本项目主要讲解大数据技术中的数据采集技术,作为大数据的开源活水,教你从头搭建高并发、高可靠、可扩展的海量日志采集系统;供离线和在线数据分析系统使用。

项目架构 Nginx、SpringBoot + MySql + Flume + Kafka + Sqoop + Hadoop + Logstash + Zookeeper

项目场景 为大多数企业提供用户行为数据采集、后台业务数据采集的可扩展、高容错的日志收集方案。

项目技术 数据采集系统的搭建、Flume安装、Flume组件和配置、自定义Flume拦截器、Flume的内存优化、Kafka集群配置、Kafka压测、Sqoop数据导入并保证数据一致性

项目特色 针对多种多样、数据量大,变化快的数据源搭建数据采集系统、如何保证数据采集的可靠性的性能、如何避免重复数据、保证实现atleast-once消费语义、如何保证数据的质量,基于企业实战经验,给出最优解决方案,掌握数据采集核心技术要点。

大数据项目谷粒旅游

项目名称 尚硅谷数据仓库

项目简介 该项目以国内电商巨头实际业务应用场景为依托,紧跟大数据主流需求,对电商数仓的常见实战指标以及难点实战指标进行了详尽讲解,让你迅速成长,获取最前沿的技术经验。

项目架构 NApache版本框架:Flume、Kafka、Sqoop、MySql、HDFS、Hive、Tez、Spark、Presto、Druid等, CDH版本框架:ClouderaManager、Hadoop、Zookeeper、Hive、Flume、Kafka、Oozie、Impala、HUE、Kudu、Spark、kylin、hbase

项目场景 数仓项目广泛应用于大数据领域,该项目技术可以高度适配电商、金融、医疗、在线教育、传媒、电信、交通等各领域;

项目技术 针对企业实战需求,实现需求:每日、周、月活跃设备明细、留存用户比例、沉默用户、回流用户、流失用户统计、最近连续3周活跃用户统计、最近7天内连续3天活跃用户统计、GMV成交总额分析、转化率及漏斗分析、品牌复购率分析、订单表拉链表的设计等。

项目特色 本课程结合国内多家企业实际项目经验,特别加入了项目架构模块,从集群规模的确定到框架版本选型以及服务器选型,手把手教你从零开始搭建大数据集群。并且总结大量项目实战中会遇到的问题,针对各个技术框架,均有调优实战经验总结,具体包括:常用Linux运维命令、Hadoop集群调优、Flume组件选型及性能优化、Kafka集群规模确认及关键参数调优。通过这部分学习,助学生迅速成长,获取前沿技术经验,从容解决实战问题。

大数据项目谷粒旅游

项目名称 谷粒在线教育

项目简介 该项目基于洋葱教育的实际业务场景,带你从0到1搭建实现数据采集系统、离线指标统计、实时计算以及用户画像等各种实际企业需求场景。紧跟企业前沿新技术,项目在手,天下你有。

项目架构 Flume + Kafka + Hadoop + Hive + SparkSql +SparkStreaming + Azkaban + Zookeeper + Mysql

项目场景 以真实企业在线教育项目为蓝图设计的实操性很高的项目,助你了解大数据从业人员的真实工作流程;

项目技术 离线指标计算:课程学习反馈指标、系统版本访问统计、渠道新用户统计、访问次数分布、漏斗分析、七日留存分析;实时数据处理:实时统计Vip用户新增数、订单行为异常用户及时运营、exactly-once语义数据消费机制;用户画像:用户画像理论和应用方向、用户画像需求实现

项目特色 参照真实企业项目流程打造,从服务器搭建选型到数据处理全流程呈现,主流数据采集系统搭建,常见离线指标需求多种解决方案,构建高可用高性能的实时流式计算,脱敏后的企业真实数据,原始数据1亿条,项目可以无缝应用于中小企业的生产环境,服务器真实使用阿里云服务。

大数据项目谷粒旅游

项目名称 尚硅谷旅游大数据

项目简介 该项目基于某大型互联网旅游公司的真实项目搭建,筛选出多个经典需求要求学生独立完成,在项目完成过程中,让学生从大数据项目的搭建到需求的实现与展示全方位的了解大数据生态,获取宝贵的项目实战经验。

项目架构 Maven+MySQL+Hadoop+Hive+Zookeeper+Azkaban+Scala+SparkCore+SSM+Echarts

项目场景 以互联网旅游为背景,多方面了解大数据在各行业的应用。

项目技术 指定路线时间段内客流量统计、交通方式人次统计、成熟客源市场分析、成熟景区市场分析、成熟景区出入分析、潜在客源市转化率分析、洞察游客行为、对游客进行用户画像、深入挖掘客源地动态和目的地2活动、产品匹配等内容

项目特色 课程注重学生的实战经验累积培养,在项目中对大数据生态中的各个常用框架加强认知,针对不同水平学生制定对应学习计划,短时间内提升学生实战水平。

没有对比 就没有伤害

技术在进步,尚硅谷始终超越平凡

  • 一般机构
  • 较好机构
  • 尚硅谷教育

尚硅谷大数据课程

Java基础 NIO MySQL JDBC HTML5与CSS3 jQuery AJAX&JSON Servlet JSP Cookie&Session Spring SpringMVC MyBatis Maven Redis Git/Git Hub Shell Linux Hadoop Hive
Zookeeper Java8 Scala Spark Core Spark SQL Spark Streaming ElasticSearch Kafka
大数据培训机构
HBase Java9 Java10 MySQL优化 JVM原理 JUC多线程 CDH版Hadoop Impala Flume Sqoop Azkaban Oozie HUE Kettle Kylin Spark Mllib机器学习 Flink Python SpringBoot Hadoop3.x新特性 ClickHouse Kudu Presto Druid Ambari DataX Logstash Kibanna 数据结构

看课程就明白,谁才是真正的实力派

授课内容全面深入,直击核心

  • 01Java编程语言概述
    • Java编程语言发展简史
    • Java编程语言主要特征
    • Java技术体系平台
    • Java核心机制与JVM运行原理
    • 搭建 Java开发环境
    • JDK 的安装与配置
    • 开发体验 Java 应用程序
    • Java 程序的执行原理
    • Java Code Style
    • 变量的声明与使用
    • 变量内存空间分配与原理
    • 进制与位运算
    • 变量的数据类型
    • 数据类型之间的转换
    • 变量的运算与底层运算原理
  • 02Java基础语法
    • 流程控制语句
    • Java 编译器执行流程
    • if 分支结构
    • switch 选择结构与相关规则
    • 循环结构
    • for 循环
    • while 循环
    • do-while 循环语句
    • 各语句性能对比与应用场景
    • 特殊流程控制语句
    • 方法的声明与使用
    • 方法调用的过程分析
    • 跨类调用方法
    • 参数的值传递
    • 方法的重载 Overload
  • 03面向对象编程
    • 类和对象
    • 对象的属性和方法
    • Java 的内存管理与垃圾回收
    • JVM 的内存结构
    • 面向对象的三大特性
    • 对象的关联关系
    • Object 类的结构与方法
    • 继承中类中各个成员特点
    • 方法重写 Override
    • 访问权限修饰符
    • 多态与虚拟方法调用
    • instanceof 运算符
    • 多态的应用之多态数组
    • 多态的应用之多态参数
    • 对象类型的转换
  • 04Java数组
    • static 修饰符
    • 类的成员之代码块
    • 静态代码块与非静态代码块
    • 单例 (Singleton) 设计模式
    • final 修饰符
    • 包 (package) 的管理与作用
    • DOS 命令行下编译器操作
    • 使用 jar 命令打包应用程序
    • 数组的创建与使用
    • 一维数组与多维数组
    • 数组的默认初始化与内存分析
    • 数组的常见算法分析
    • 操作数组的工具类 Arrays
    • 命令行参数
    • 可变参数
  • 05高级类特性
    • 抽象类 (abstract) 实际应用举例
    • 接口 (interface) 的应用与常见问题
    • Template Method 设计模式
    • Factory Method 设计模式
    • 代理模式 (Proxy)
    • 类的成员之内部类
    • 匿名内部类
    • Java8 中匿名内部类的新特性
    • Enum枚举
    • 枚举的属性与方法
    • 接口实现枚举类
    • Annotation 注解
    • JDK 内置注解
    • 自定义注解
    • 元注解
  • 06Java API
    • Wrapper 包装类
    • 装箱与拆箱
    • 包装类的缓存分析
    • 字符串处理类
    • String 类的使用与内存原理
    • String 类的算法分析
    • StringBuffer 与 StringBuilder
    • 字符串处理类性能分析
    • 其他常用类
    • Java.lang.System类
    • Java.util.Date类
    • Java.text.SimpleDateFormat类
    • Java.util.Calendar类
    • Java.lang.Math类
    • Java.math.BigInteger类与Java.math.BigDecimal
  • 07异常处理
    • 异常的原理
    • 异常的堆栈抛出机制
    • 异常的结构体系
    • 受检与非受检异常
    • 异常的处理
    • try-catch 示例
    • 使用finally回收资源
    • throw 制造异常
    • 异常的处理方式之throws
    • Java 7增强的throw 语句
    • 方法重写与 throws
    • 自定义异常
    • 实战中自定义异常的应用解析
    • 异常信息的访问
    • Java 程序的常见问题及解决方法
  • 08集合与泛型
    • 集合框架概述
    • Collection 系列集合
    • List 系列集合与Set系列集合
    • java.util.ArrayList源码与数据结构分析
    • java.util.LinkedList 源码分析
    • java.util.HashSet 内部原理
    • java.util.TreeSet 数据结构分析
    • java7 中Map 系列集合与数据结构分析
    • java8 中 Map 系列集合新特性对比
    • java.util.concurrent.ConcurrentHashMap
    • Iterator 与 ListIterator
    • Collections 工具类
    • 集合中使用泛型
    • 自定义泛型
    • 通配符
  • 09Java IO流
    • IO流结构体系
    • IO流原理分析
    • IO流的分类
    • IO流与文件操作
    • IO流的包装与链接
    • 缓冲流
    • 文件的复制与性能对比
    • 对象流
    • 对象的序列化与反序列化
    • 控制台IO
    • 标准输入流与标准输出流
    • 打印流
    • 转换流
    • 字符编码与解码
    • RandomAccessFile 类
  • 10Java 多线程
    • 线程的原理
    • 线程的创建与启动
    • 创建线程的几种方式对比
    • 继承 Thread 类与实现 Runnable 接口
    • 创建线程方式对比
    • 线程的控制
    • 线程的调度
    • 线程的优先级
    • 线程的生命周期
    • 多线程的安全问题与解决办法
    • 线程的同步
    • 互斥锁
    • 线程的死锁问题
    • 线程通信
    • 生产者与消费者案例
  • 11Java Reflection
    • Java 反射机制的研究与应用
    • 反射的原理分析
    • JVM与类
    • 类的加载、连接、初始化
    • 类初始化的时机
    • 类加载器 ClassLoader简介
    • 类加载机制
    • 创建并使用自定义的类加载器
    • 开启反射的源头 Class
    • 获取 Class 实例的四种方式
    • 从 Class 中获取信息
    • Proxy 和 InvocationHandler 创建动态代理
    • 动态代理和AOP(Aspect Orient Programming)
    • 泛型和Class类
    • 使用反射来获取泛型信息
  • 12网络编程
    • 网络编程基础知识
    • 网络编程的主要问题
    • 如何实现网络中主机的相互通讯
    • 网络通讯要素
    • 网络通信协议
    • OSI参考模型
    • TCP/IP参考模型(或TCP/IP协议)
    • 数据的封装与拆封
    • Java.net.InetAddress 类
    • TCP 协议与UDP协议
    • 基于TCP协议的网络编程
    • Socket 的TCP编程
    • 基于UDP协议的网络编程
    • URL编程
    • 针对HTTP协议的URLConnection
  • 13Java8 新特性
    • Lambda 表达式
    • 类型推断
    • Java8核心函数式接口
    • Lambda表达式的参数传递
    • 方法引用与构造器引用
    • 强大的 Stream API
    • Stream 操作的核心步骤
    • 惰性求值与内部迭代
    • 筛选与切片
    • 映射与排序
    • 查找与匹配
    • 归约与收集
    • 并行流与串行流
    • Optional 容器类
    • ....
  • 14Mysql 基础
    • Mysql的安装和使用
    • 图解Mysql程序结构
    • Mysql服务器的配置
    • Mysql 客户端使用
    • 用户权限管理
    • Mysql数据库的使用
    • SQL语句的三种类型
    • DML、DDL、DCL的应用
    • 数据处理
    • 子查询
    • 创建和管理表
    • 约束与分页
    •  
    •  
    •  
  • 15JDBC
    • JDBC概述
    • 获取数据库连接
    • 数据库连接池C3P0 与 DBCP
    • 使用JDBC 完成数据库DML操作
    • 大数据的操作
    • 批量处理与元数据
    • 使用QueryRunner
    • 可插拔式结果集处理
    • 批量处理
    • 大数据结果集处理
    • 自定义结果集处理
    • 利用DBUtils编写通用 DAO
    • 使用 JdbcTemplate
    • 使用 JdbcDaoSupport
    • 使用 NamedParameterJdbc
  • 01 Java WEB核心
    • JavaWeb的技术体系
    • 登录页面的开发
    • 登录功能实现-环境的搭建
    • 登录功能实现-LoginServlet
    • 登录功能实现-页面中错误提示
    • 注册功能实现-异步的表单校验
    • 登录功能实现-登录成功跳转主页面
    • 主页面访问权限控制
    • 在线人数统计
  • 02Maven
    • Maven环境搭建
    • Maven构建&自动化构建
    • 本地仓库&中央仓库
    • maven创建web工程
    • pom.xml、依赖管理
    • 坐标、依赖、生命周期等
    • eclipse下的maven使用
    • 继承&聚合
    • 自动部署
  • 03Spring
    • SpringIOC&DI机制
    • Spring配置式组件管理
    • Spring注解式自动装配
    • Spring表达式语言
    • SpringAOP&动态代理
    • SpringJDBC使用
    • Spring声明式事务
    • Spring单元测试
    • Spring源码分析
  • 04 SpringBoot
    • 流行分布式架构
    • Spring分布式架构
    • SpringBoot 概述
    • 为什么要使用SpringBoot
    • Spring 前世今生
    • 自动创建一个SpringBoot项目
    • 手动创建一个SpringBoot 项目
    • SpringBoot 集成 Spring & Spring Web MVC
    • SpringBoot 集成 MyBatis
  • 05Git&Git Hub
    • Git安装配置
    • Git本地库搭建
    • Git常用操作命令
    • Github注册与配置
    • Github与Git协同办公
    • TortoiseGit安装配置
    • Egit操作push/pull,
    • Git工作流
    • 集中式&GitFlow&Forking
  • 06Linux入门 & VI/VIM
    • Linux概述
    • Linux和Windows区别
    • Centos下载地址
    • 安装VMWare虚拟机
    • 安装CentOS
    • 安装VMTools工具
    • Linux文件、目录结构
    • VI/VIM一般模式
    • VI/VIM编辑模式
    • VI/VIM指令模式
    • VI/VIM模式间转换
  • 07系统管理操作&远程登录
    • 查看网络IP和网关
    • 配置网络ip地址
    • 配置主机名
    • 防火墙配置
    • 关机重启命令
    • 找回root密码
    • 克隆虚拟机
    • 安装SecureCRT(英文版)
    • 中文版SecureCRT的使用
    • SecureCRT中文乱码解决方法
    • 安装Xshell
  • 08常用命令
    • 帮助命令
    • 文件目录类命令
    • 时间日期类命令
    • 用户管理命令
    • 用户组管理命令
    • 文件权限类命令
    • 搜索查找类命令
    • 压缩和解压类命令
    • 磁盘分区类命令
    • 进程线程类命令
    • crond 系统定时任务
  • 09软件包管理 & 企业真题
    • RPM概述
    • RPM查询命令(rpm -qa)
    • RPM卸载命令(rpm -e)
    • RPM安装命令(rpm -ivh)
    • YUM概述
    • YUM的常用命令
    • 修改网络YUM源
    • 常见错误及解决方案
    • 百度面试真题
    • 考满分面试真题
    • 瓜子二手车面试真题
  • 10Shell编程
    • Shell概述
    • Shell解析器
    • Shell脚本入门
    • Shell中变量
    • 自定义变量
    • 特殊变量$n、$#
    • 特殊变量$*、$@、$?
    • 运算符
    • 条件判断
    • 流程控制if、case、for、while
    • read读取控制台输入
  • 11Shell高级&企业真题
    • 系统函数
    • 自定义函数
    • Shell工具cut
    • Shell工具sed
    • Shell工具awk
    • Shell工具sort
    • 京东面试真题
    • 搜狐面试真题
    • 和讯网面试真题
  • 12Redis
    • NoSQL&Redis入门
    • Redis/memcache/MongDB对比
    • Redis安装&启动
    • 分布式数据库CAP原理
    • Redis五大数据类型和基本操作命令
    • Redis总体配置Redis.conf
    • Redis持久化(RDB和AOF)
    • Redis事务控制
    • Redis发布和订阅
  • 13MySQL高级
    • MySQL架构组成
    • MySQL备份和恢复
    • MySQL查询和慢查询日志分析
    • MySQL索引优化
    • MySQL存储引擎优化
    • MySQL锁机制优化
    • MySQL高可用设计
    • MySQL集群
    •  
  • 14JVM原理
    • JVM简析
    • JVM组成结构
    • JVM堆、栈原理
    • JVM-Heap三区原理
    • JVM垃圾收集机制
    • 堆内存调优
    • GC回收策略
    • GC三大算法
    •  
  • 15 JUC 线程高级
    • 内存可见性分析
    • 原子变量与CAS (Compare And Swap) 算法分析
    • ConcurrentHashMap 锁分段机制
    • CountDownLatch 闭锁
    • Lock 同步锁
    • Condition 控制线程通信
    • 线程按序交替
    • ReadWriteLock 读写锁
    • 线程调度
  • 01大数据概论 & Hadoop生态
    • 大数据概念
    • 大数据的特点(4V)
    • 大数据应用场景
    • 大数据发展前景
    • 大数据部门业务流程分析
    • 大数据部门组织结构(重点)
    • Hadoop是什么
    • Hadoop发展历史
    • Hadoop三大发行版本
    • Hadoop的优势(4高)
  • 02Hadoop入门
    • Hadoop组成
    • HDFS架构概述
    • YARN架构概述
    • MapReduce架构概述
    • 大数据技术生态体系
    • 推荐系统框架图
    • Hadoop运行环境搭建
    • 虚拟机环境准备
    • 安装JDK、安装Hadoop
    • Hadoop目录结构
  • 03 Hadoop运行模式
    • 本地运行模式
    • 官方Grep案例
    • 官方WordCount案例
    • 伪分布式运行模式
    • 启动HDFS并运行MapReduce程序
    • 启动YARN并运行MapReduce程序
    • 配置历史服务器
    • 配置日志的聚集
    • 配置文件说明
    • 完全分布式运行模式
  • 04完全分布式模式&源码编译
    • 虚拟机准备
    • 编写集群分发脚本xsync
    • 集群配置
    • 集群单点启动
    • SSH无密登录配置
    • 群起集群
    • 集群启动/停止方式总结
    • 集群时间同步
    • Hadoop编译源码
    • 常见错误及解决方案
  • 05 HDFS入门
    • HDFS概述
    • HDFS产出背景及定义
    • HDFS优缺点
    • HDFS组成架构
    • HDFS文件块大小
    • HDFS的Shell操作
    • HDFS客户端操作
    • HDFS客户端环境准备
    • HDFS的API操作
    • HDFS文件上传
  • 06HDFS的API操作
    • HDFS文件下载
    • HDFS文件夹删除
    • HDFS文件名更改
    • HDFS文件详情查看
    • HDFS文件和文件夹判断
    • HDFS的I/O流操作
    • HDFS文件上传
    • HDFS文件下载
  • 07HDFS的框架原理
    • 定位文件读取
    • HDFS的数据流
    • HDFS写数据流程
    • 剖析文件写入
    • 网络拓扑-节点距离计算
    • 机架感知
    • 副本存储节点选择
    • HDFS读数据流程
  • 08NN & DN工作机制
    • NameNode&2NN工作机制
    • Fsimage和Edits解析
    • CheckPoint时间设置
    • NameNode故障处理
    • 集群安全模式
    • NameNode多目录配置
    • DataNode工作机制
    • 数据完整性
  • 09DN工作机制&新特性
    • 掉线时限参数设置
    • 服役新数据节点
    • 退役旧数据节点
    • 添加白名单
    • 黑名单退役
    • Datanode多目录配置
    • HDFS 2.X新特性
    • 集群间数据拷贝
  • 10新特性& HA框架原理
    • 小文件存档
    • 回收站
    • 快照管理
    • HA概述
    • HDFS-HA工作机制
    • HDFS-HA工作要点
    • HDFS-HA自动故障转移工作机制
    • HDFS-HA集群配置
  • 11HDFS-HA集群配置
    • 环境准备
    • 规划集群
    • 配置Zookeeper集群
    • 配置HDFS-HA集群
    • 启动HDFS-HA集群
    • 配置HDFS-HA自动故障转移
    • YARN-HA配置
    • YARN-HA工作机制
    • 配置YARN-HA集群
    • HDFS Federation架构设计
  • 12MapReduce框架原理
    • MapReduce核心思想
    • MapReduce进程
    • MapReduce编程规范(八股文)
    • MapReduce程序运行流程分析
    • MapReduce工作流程
    • 常用数据序列化类型
    • 自定义bean对象实现序列化接口
    • FileInputFormat切片机制
    • CombineTextInputFormat切片机制
    • 自定义InputFormat
  • 13Shuffle机制
    • MapTask工作机制
    • 并行度决定机制
    • Shuffle机制
    • Partition分区
    • WritableComparable排序
    • GroupingComparator分组(辅助排序)
    • Combiner合并
    • 数据倾斜&Distributedcache
    • ReduceTask工作机制
    • 自定义OutputFormat
  • 14数据压缩 & Yarn
    • MapReduce支持的压缩编码
    • 采用压缩的位置
    • 压缩配置参数
    • 计数器应用、数据清洗
    • Yarn基本架构、工作机制
    • Yarn资源调度器、任务推测执行
    • MapReduce作业提交全过程
    • MapReduce开发总结
    • MapReduce参数优化
    • 企业高频真题讲解20道
  • 15MapReduce案例(一)
    • 案例一:统计一堆文件中单词出现的个数
    • 案例二:把单词按照ASCII码奇偶分区
    • 案例三:对每一个maptask的输出局部汇总
    • 案例四:大量小文件的切片优化
    • 案例五:统计手机号耗费的流量
    • 案例六:按照手机归属地不同省份输出到不同文件中
    • 案例七:按照总流量倒序排序
    • 案例八:不同省份输出文件内部排序
    • 案例九:求每个订单中最贵的商品
    • 案例十:Reduce端表合并(数据倾斜)
  • 16MapReduce案例(二)
    • 案例十一:Map端表合并(Distributedcache)
    • 案例十二:小文件处理(自定义InputFormat)
    • 案例十三:自定义日志输出路径(自定义OutputFormat)
    • 案例十四:日志清洗(数据清洗)
    • 案例十五:倒排索引(多job串联)
    • 案例十六:找博客共同好友分析
    • 案例十七:对数据流的压缩和解压缩
    • 案例十八:在Map输出端采用压缩
    • 案例十九:在Reduce输出端采用压缩
    • 案例二十:TopN案例
  • 17Hadoop 3.x新特性
    • Hadoop 3.x和2.x主要区别
    • 最低Java版本需求由7升级为8
    • 引入纠删码
    • Yarn 时间线服务升级到V2
    • 重写了Shell脚本
    • 引入了新的API依赖
    • MapReduce 任务的本地化优化
    • 支持超过两个NN
    • 许多服务的默认端口改变了
    •  
  • 18Hadoop3.x安装使用
    • DataNode内部实现Balancer
    • 重做的后台和任务堆内存管理
    • HDFS实现服务器级别的Federation分流
    • 容量调度器实现API级别的配置
    • Yarn实现更多种资源类型的管理
    • 配置环境变量
    • 配置Hadoop核心文件
    •  
    •  
    •  
  • 19Zookeeper原理
    • Zookeeper概述、特点
    • Zookeeper数据结构
    • Zookeeper应用场景
    • Zookeeper下载地址
    • Zookeeper本地模式安装
    • 配置参数解读
    • Zookeeper内部原理
    • Zookeeper选举机制
    • Zookeeper节点类型
    • Stat结构体
  • 20Zookeeper原理&实战
    • 监听器原理、写数据流程
    • 分布式安装部署
    • 客户端命令行操作
    • API应用环境搭建
    • 创建ZooKeeper客户端案例
    • 创建子节点案例
    • 获取子节点并监听节点变化案例
    • 判断Znode是否存在案例
    • 监听服务器节点动态上下线案例
    • 企业高频真题讲解3道
  • 21Hive入门&安装
    • 什么是Hive
    • Hive的优缺点
    • Hive架构原理
    • Hive和数据库比较
    • Hive安装地址
    • Hive安装部署
    • 将本地文件导入Hive案例
    • MySql安装
    • 安装MySql服务器
    • 安装MySql客户端
  • 22 Hive远程连接
    • MySql中user表中主机配置
    • Hive元数据配置到MySql
    • 驱动拷贝
    • 配置Metastore到MySql
    • 多窗口启动Hive测试
    • HiveJDBC访问
    • 启动hiveserver2服务
    • 启动beeline
    • 连接hiveserver2
    • Hive常用交互命令
  • 23 Hive命令 & 数据类型
    • Hive其他命令操作
    • Hive常见属性配置
    • Hive数据仓库位置配置
    • Hive查询后信息显示配置
    • Hive运行日志信息配置
    • 参数配置方式
    • Hive数据类型
    • Hive基本数据类型
    • Hive集合数据类型
    • 类型转化
  • 24Hive DDL数据定义
    • 创建数据库
    • 查询数据库
    • 修改数据库
    • 删除数据库
    • 创建管理表
    • 创建外部表
    • 管理表与外部表的互相转换
    • 分区表基本操作
    • 分区表注意事项
    • 修改表、删除表
  • 25Hive DML数据操作
    • 向表中装载数据(Load)
    • 通过查询语句向表中插入数据(Insert)
    • 查询语句中创建表并加载数据(as select)
    • 创建表时通过location指定加载数据路径
    • Import数据到指定hive表中
    • Insert导出
    • Hadoop命令导出到本地
    • Hive Shell 命令导出
    • Export导出到HDFS上
    • 清除表中数据(Truncate)
  • 26Hive查询
    • 全表和特定列查询
    • 列别名
    • 算术运算符、常用函数
    • LIMIT语句
    • WHERE语句
    • 比较运算符(BETWEEN/IN/ IS NULL)
    • LIKE和RLIKE
    • 逻辑运算符(AND/OR/NOT)
    • 分组、GROUP BY语句
    • HAVING语句
  • 27Hive JOIN & 排序
    • 等值JOIN & 表的别名
    • 内连接
    • 左外连接、右外连接
    • 满外连接、多表连接
    • 笛卡尔积 JOIN
    • 全局排序(Order By)
    • 按照别名排序、多个列排序
    • 每个MapReduce内部排序(Sort By)
    • 分区排序(Distribute By)
    • CLUSTER BY
  • 28Hive分桶 & 函数
    • 分桶表数据存储
    • 分桶抽样查询
    • 常用查询函数
    • 空字段赋值
    • CASE WHEN
    • 行转列
    • 列转行
    • 窗口函数
    • Rank
    • 系统内置函数
  • 29Hive函数 & 压缩 & 存储
    • 自定义UDF、UDAF、UDTF函数
    • 压缩和存储
    • 源码编译支持Snappy压缩
    • 开启Map输出阶段压缩
    • 开启Reduce输出阶段压缩
    • 列式存储和行式存储
    • TextFile格式、Orc格式
    • Parquet格式
    • 主流文件存储格式对比实验
    • 存储和压缩结合案例
  • 30企业级调优
    • Fetch抓取
    • 本地模式
    • 表的优化
    • 小表、大表Join
    • 大表Join大表
    • MapJoin
    • Group By
    • Count(Distinct) 去重统计
    • 笛卡尔积
    • 行列过滤
  • 31Hive企业级调优(二)
    • 动态分区调整
    • 分桶、分区
    • Map数
    • 小文件进行合并
    • 复杂文件增加Map数
    • Reduce数
    • 并行执行、严格模式
    • JVM重用、推测执行
    • 压缩
    • EXPLAIN(执行计划)
  • 32企业级调优 & 项目实战
    • 项目视频表
    • 项目用户表
    • 项目技术选型
    • 数据清洗
    • 数据分析
    • ETL之ETLUtil
    • ETL之Mapper
    • ETL之Runner
    • 执行ETL
    • 项目数据准备
  • 33Hive项目实战&企业真题
    • 统计视频观看数Top10
    • 统计视频类别热度Top10
    • 统计出视频观看数最高的20个视频的所属类别以及类别包含Top20视频的个数
    • 统计视频观看数Top50所关联视频的所属类别Rank
    • 统计每个类别中的视频热度Top10,以Music为例
    • 统计每个类别中视频流量Top10,以Music为例
    • 统计上传视频最多的用户Top10以及他们上传的观看次数在前20的视频
    • 统计每个类别视频观看数Top10
    • 项目总结
    • 企业高频真题讲解2道
  • 34 IDEA
    • IDEA介绍
    • Windows下安装过程
    • 启动应用后简单配置
    • 创建工程
    • 设置显示常见的视图
    • 工程界面展示
    • 创建package和class
    • 设置常用配置20项
    • 设置快捷键、自定义模板
    • 关联Tomcat、Web项目案例
  • 35 Flume(一)
    • Flume概述/基础架构
    • Flume快速入门
    • Flume案例实操
    • Flume进阶案例
    • Flume事务、Agent内部原理
    • Flume拓扑结构
    • Flume企业开发案例
    • 自定义Interceptor、Source、Sink
    • Flume数据流监控-Ganglia
    • 企业真实面试题(重点)
  • 36 Kafka(一)
    • Kafka概述
    • 定义
    • 消息队列(Message Queue)
    • Kafka基础架构
    • Kafka快速入门
    • 安装部署
    • Kafka命令行操作
    • Kafka架构深入
    • Kafka工作流程及文件存储机
  • 37 Kafka(二)
    • Kafka 高效读写数据
    • Zookeeper在Kafka中的作用
    • Kafka API
    • Producer API
    • Consumer API
    • 自定义Interceptor
    • Flume对接Kafka
    • Kafka监控
    • Kafka Monitor、Manager
  • 38Hbase(一)
    • HBase简介
    • HBase定义
    • HBase数据模型
    • HBase基本架构
    • HBase快速入门
    • HBase安装部署
    • HBase Shell操作
    • HBase进阶
    • RegionServer 架构
  • 39Hbase(二)
    • 读流程
    • StoreFile Compaction
    • Region Split
    • HBase API
    • 环境准备
    • 官方以及自定义HBase-MapReduce
    • 与Hive的集成
    • HBase优化
    • 高可用
  • 40Hbase(三)
    • 内存优化
    • 基础优化
    • HBase实战之谷粒微博
    • 需求分析
    • 代码实现
    • 扩展
    • HBase在商业项目中的能力
    • 布隆过滤器
    • HBase2.0新特性
  • 41Hbase(四)微博项目
    • 代码设计总览
    • 创建命名空间以及表名的定义
    • 创建微博内容表
    • 创建用户关系表
    • 创建微博收件箱表
    • 发布微博内容
    • 添加关注用户
    • 移除(取关)用户
    • 获取关注的人的微博内容
    • 测试
  • 42Sqoop
    • Sqoop简介
    • Sqoop原理
    • Sqoop安装
    • Sqoop的简单使用案例
    • 导入数据
    • 导出数据
    • 脚本打包、常用命令列举
    • 命令&参数详解
    • Sqoop的案例实操
    •  
  • 43 Kylin
    • Kylin概述
    • Kylin环境搭建
    • Kylin快速入门
    • Kylin的Cube构建原理
    • Cube构建优化
    • BI工具集成
    • JDBC
    • Zepplin
    • Kylin的案例实操
    • 常见问题解答
  • 44Azkaban
    • Azkaban概述
    • 安装Azkaban
    • 生成密钥对和证书
    • 时间同步配置
    • 配置文件
    • 启动executor服务器
    • 启动web服务器
    • Azkaban实战
    • 多job工作流案例
    • 常见问题以及面试题总结
  • 45Oozie
    • Oozie的功能模块介绍
    • 模块&常用节点
    • Oozie的部署
    • 部署Hadoop(CDH版本的)
    • 部署Oozie
    • 案例一:Oozie调度shell脚本
    • 案例二:Oozie逻辑调度执行多个Job
    • 案例三:Oozie调度MapReduce任务
    • 案例四:Oozie定时任务/循环任务
    • 常见问题以及面试题总结
  • 46Kettle
    • kettle概述
    • 什么是kettle
    • kettle特点
    • kettle安装部署和使用
    • Windows下安装使用
    • 创建资源库
    • Linux下安装使用
    • Kettle调优
    • 企业面试题总结
    •  
  • 47ClickHouse
    • 什么是ClickHouse
    • 列式存储
    • ClickHouse安装
    • 单机模式
    • 分布式集群安装
    • 整型、浮点型、布尔型
    • 字符串、枚举类型、数组、元组、Date
    • TinyLog、Memory、MergeTree、ReplacingMergeTree
    • SummingMergeTree、Distributed
    • 案例实操&常见问题总汇
  • 48Cloudera Manager & Impala
    • CM概念
    • CM功能
    • CM环境准备
    • CM安装部署
    • CM案例实操
    • Impala入门
    • 什么是Impala
    • Impala优缺点
    • Impala架构
    • Impala下载地址
  • 49 Impala安装
    • Impala安装方式
    • Impala监护管理
    • Impala初体验
    • Impala的操作命令
    • Impala的外部shell
    • Impala的内部shell
    • Impala的数据类型
    • DDL数据定义
    • 创建数据库
    • 查询数据库
  • 50Impala操作
    • 创建管理表、外部表
    • 创建分区表
    • 向表中导入数据
    • 查询分区表中的数据
    • 增加多个分区
    • 删除分区、查看分区
    • 数据导入、导出
    • 自定义函数
    • 存储和压缩
    • 优化
  • 51HUE
    • HUE概述
    • 来源
    • 官网及使用者
    • HUE安装及使用
    • 安装环境准备
    • 正式安装
    • HUE案例实操
    •  
    •  
  • 52 Kudu
    • Kudu定义及基础架构
    • Kudu快速入门
    • 配置impala支持kudu
    • 案例实操
    • API操作
    • 创建表、删除表
    • 插入数据、查询数据
    • 更改表数据、删除指定行
    • 获取所有kudu表
  • 53CDH升级安装组件
    • CDH5.12.1安装spark2.1
    • 升级安装
    • 点击分配
    • 点击激活
    • 添加服务
    • 选择依赖
    • 部署并启动
    • 错误解决
    • 命令行查看
  • 54Presto
    • Presto概念、应用场景
    • Presto架构
    • Presto数据模型
    • Presto优缺点
    • Presto、Impala性能比较
    • Presto安装部署
    • 配置Presto连接Hive
    • Presto案例实操
    • Presto优化
  • 55Druid
    • Druid概念、特点
    • Druid应用场景
    • Druid对比Impala/Presto/SparkSQL/Kylin/ES
    • Druid框架原理
    • Druid数据结构
    • Druid安装
    • Web页面使用
    • 停止服务
    • Druid案例实操
  • 56Ambari
    • 什么是Ambari
    • Ambari功能
    • 环境准备
    • 安装Ambari集群
    • 制作本地源
    • 安装MySQL、Ambari
    • 配置、启动Ambari
    • HDP集群部署
    • 安装Hive
    • 常见问题解答
  • 57DataX
    • 什么是DataX
    • DataX的设计
    • 框架设计
    • 运行原理
    • DataX官方地址
    • DataX前置要求
    • DataX安装
    • 案例实操:读取MySQL中的数据存放到HDFS
    • 案例实操:读取HDFS数据写入MySQL
    • DataX优化
  • 58Elasticsearch入门
    • ElasticSearch介绍
    • ElasticSearch结构
    • elasticsearch与数据库的类比
    • ElasticSerach单机安装和使用
    • ElasticSerach案例实操
    • ES高级特性
    • ES数据存入和搜索机制
    • 分词
    • IK分词器简介
    • IK分词器安装
  • 59Elasticsearch & Kibana
    • IK分词器案例实操
    • 数据类型
    • Kibana安装
    • Kibana功能简介
    • Kibana案例实操1
    • Kibana案例实操2
    • Kibana案例实操3
    • Kibana优化
    •  
    •  
  • 60Logstash
    • Logstash
    • 安装及使用logstash
    • 输入、输出、过滤
    • ELK集群安装
    • 安装启动ES集群
    • 集群安装注意事项
    • ELK实战与总结
    • 实战需求、步骤
    • 常见问题总汇以及解决
    • 常见面试问答
  • 01 scala的概述
    • 安装Scala
    • 学习sdala的原因
    • Scala语言诞生小故事
    • Scala 和 Java 以及 jvm 的关
    • Scala语言的特点
    • Windows下搭建Scala开发环境
    • Linux下搭建Scala开发环境
    • Scala开发工具的介绍
    • scala的开发的快速入门
    • Scala语言转义字符
    • Scala语言输出的三种方式
  • 02 Scala变量
    • 变量是程序的基本组成单位
    • 变量的介绍
    • scala变量的基本使用
    • Scala变量便用说明
    • 整数类型
    • 浮点类型
    • 字符类型(Char)
    • 布尔类型:Boolean
    • Unit类型、Null类型和Nothing类型
    • 值类型转换
    • 数据类型转换的作业題
  • 03Scala运算符
    • 标识符的命名规范
    • 运算符介绍
    • 默运算符
    • 关系运算符
    • 比较运算符
    • 逻辑运算符
    • 赋值运算符
    • 运算符优先级
    • 键盘输入语句
    • 案例实操
    •  
  • 04程序流程控制
    • 程序的流程控制说明
    • 顺序控制的说明
    • 分支控制if~else
    • 嵌套分支
    • switch分支结构
    • for循环控制
    • while循环控制
    • do..while循环控制
    • 多重循环控制
    • while循环的中断
    • 课后练习题
  • 05Scala函数式编程的基础
    • 函数式编程内容及授课顺序说明
    • 函数式编程介绍
    • 为什么需要函数
    • 函数的定义
    • 函数-调用机制
    • 函数注意事项和细节讨论
    • 函数练习题
    • 过程
    • 惰性函数
    • 异常
    • 函数的课堂练习题
  • 06Scala面向对象编程(基础部分)
    • 类与对象
    • 方法
    • 类与对象应用实例
    • 构造器
    • 属性高级
    • 面向对象编程(中级部分)
    • 包的可见性问题
    • 包的引入
    • 面向对象编程方法拍象
    • 面向对象编程三大特征
    • 面向对象编程-继承
    • 面向对象编程作业
  • 07Scala面向对象编程(高级特性)
    • 静态属性和静态方法
    • 单例对象
    • 接口
    • 特质(trait)
    • 嵌套类//看源码,面试
    • 隐式转换和隐式值
    • 隐式转换
    • 隐式转换丰富类库功能
    • 隐式值
    • 隐式类
    • 隐式的转换时机
    • 隐式解析机制
    • 隐式转换俩个前提
  • 08Scala数据结构(上)集合
    • 数据结构特点
    • 不可变集合继承层次一览图
    • 可变集合继承层次一览图
    • 数组一定长数组(声明泛型)
    • 数组一变长数组(声明泛型)
    • 数组一Scala数组与Java的List互转
    • 元组Tuple-元组的基本使用
    • 元组数据的访问
    • 元组数据的遍历
    • 列表 List
    • ListBuffer
    • 队列 Queue
    • 映射 Map & 集 Set
  • 09Scala数据结构(下)
    • 集合元素的映射
    • 集合元素的过滤
    • 化简
    • 折叠
    • 扫描
    • 集合综合应用案例
    • 扩展一拉链(合并)
    • 扩展一迭代器
    • 扩展一流 Stream
    • 扩展一视图 View
    • 扩展一并行集合
    • 扩展一操作符
    •  
  • 10Scala模式匹配
    • Match
    • 守卫
    • 模式中的变量
    • 类型匹配
    • 匹配数组
    • 匹配列表
    • 匹配元组
    • 对象匹配
    • 变量声明中的模式
    • for 表达式中的模式
    • 样例(模板)类
    • case 语句的中置(缀)表达式
    • 匹配嵌套结构 & 密封类
  • 11Scala函数式编程高级
    • 偏函数( partialfunction )
    • 作为参数的函数
    • 匿名函数
    • 高阶函数
    • 参数(类型)推断
    • 闭包( closure )
    • 函数柯里化( curry )
    • 控制抽象
    • 使用递归的方式去思考,去编程
    • 基本介绍
    • 提倡函数式编程(递归思想)
    • 应用实例
    • 使用函数式编程方式宇符串翻转
    • 使用递归一求阶乘
  • 12项目 Scala 客户信息管理系统
    • 项目开发流程
    • 项目需求分析
    • 项目界面
    • 项目设计-程序框架图
    • 项目功能实现
    • 并发编程模型 Akka
    • Akka 介绍
    • Actor 模型用于解决什么问题
    • Akka 中 Actor 模型
    • Actor 模型工作机制说明
    • Actor 模型快速入门
    • Actor 模型应用实例一Actor 间的通讯
    • Akka 网络编程基本介绍
    • Akka 网络编程一小黄鸡客服
  • 13Scala设计模式
    • 学习设计模式的必要性
    • 设计模式的介绍
    • 设计模式类型
    • 简单工厂
    • 工厂方法模式
    • 抽象工厂模式
    • 工厂模式的小结
    • 单例模式
    • 装饰者模式( Decorator )
    • 观察者模式( observer )
    • 代理模式(Proxy)
    •  
    •  
    •  
  • 14泛型、上下界、视图界定、上下文界定
    • 泛型的基本介绍
    • 类型约束一上界/下界
    • 类型约束一上下文界定
    • 协变、逆变和不变
    • Scala泛型应用案例
    • 上界/下界应用案例
    • 视图界定应用案例
    • 上下文界定应用案例
    • 逆变/协变应用案例
    • Scala常见面试题及解答
    •  
    •  
    •  
    •  
  • 15Spark基础解析
    • 什么是Spark
    • Spark内置模块
    • Spark特点
    • Spark运行模式
    • Spark安装地址
    • 重要角色
    • Local模式
    • Standalone模式
    • Yarn模式(重点)
    • Mesos模式(了解)
    • 几种模式对比
    • 案例实操
    • 编写WordCount程序
    • 本地调试
  • 16SparkCore应用解析(一)
    • RDD概述
    • 什么是RDD
    • RDD的属性、特点
    • RDD编程
    • 编程模型
    • RDD的创建
    • DAG的转换
    • Action
    • RDD中的函数传递
    • RDD的依赖关系
    • RDD的缓存
    • RDD的CheckPoint
  • 17SparkCore应用解析(二)
    • 键值对RDD数据分区器
    • 获取RDD分区
    • Hash分区、Ranger分区
    • 自定义分区
    • 数据读取与保存
    • 文件类数据读取与保存
    • 文件系统类数据读取与保存
    • RDD编程进阶
    • 系统累加器、自定义累加器
    • 广播变量(调优策略)
    • 扩展
    • RDD相关概念关系
  • 18SparkSQL应用解析(一)
    • 什么是Spark SQL
    • Spark SQL的特点
    • 什么是DataFrame
    • 什么是DataSet
    • SparkSQL编程
    • DataFrame
    • DataSet
    • DataFrame与DataSet的互操作
    • RDD、DataFrame、DataSet
    • IDEA创建SparkSQL程序
    • 用户自定义函数
    •  
  • 19SparkSQL应用解析(二)
    • SparkSQL数据源
    • 通用加载/保存方法
    • Parquet文件
    • JSON文件
    • JDBC
    • Hive数据库
    • Spark SQL实战
    • 数据说明
    • 加载数据
    • 计算所有订单每年最大金额订单的销售额案例
    • 计算所有订单中每年最畅销货品案例
    • 计算所有订单中每年的销售
  • 20SparkStreaming应用解析
    • Spark Streaming是什么
    • Spark Streaming特点
    • SparkStreaming架构
    • WordCount案例实操及解析
    • Dstream创建
    • 文件数据源
    • RDD队列(了解)
    • 自定义数据源
    • Kafka数据源(重点)
    • DStream转换、输出
    • 无状态、有状态转化操作
    • Window Operations
  • 21Spark内核解析(一)
    • Spark 内核概述
    • Spark核心组件回顾
    • Spark通用运行流程概述
    • Spark 部署模式
    • Standalone模式运行机制
    • YARN模式运行机制
    • Spark 通讯架构
    • Spark通信架构概述
    • Spark通讯架构解析
    • Spark 任务调度机制
    • Spark任务提交流程
    • Spark任务调度
    • Spark Stage级调度、Spar
  • 22Spark内核解析(二)
    • Spark Shuffle解析
    • Shuffle的核心要点
    • HashShuffle解析
    • SortShuffle解析
    • Spark 内存管理
    • 堆内和堆外内存规划
    • 内存空间分配
    • 存储内存管理
    • 执行内存管理
    • Spark 核心组件解析
    • BlockManager数据存储与管理机制
    • Spark 共享变量底层实现
    • 总结
  • 23Spark 性能调优(一)
    • 常规性能调优
    • 算子调优
    • Shuffle调优
    • JVM调优
    • Shuffle调优
    • Spark 数据倾斜
    • 解决方案一:聚合原数据
    • 解决方案二:过滤导致倾斜的key
    • 解决方案三:提高shuffle操作中的reduce并行度
    • 解决方案四:使用随机key实现双重聚合
    • 解决方案五:将reduce join转换为map join
    • 解决方案六:sample采样对倾斜key单独进行join
    • 解决方案七:使用随机数以
  • 24Spark 性能调优(二)
    • Spark Troubleshooting
    • 故障排除一:控制reduce端缓冲大小以避免OOM
    • 故障排除二:JVM GC导致的shuffle文件拉取失败
    • 故障排除三:解决各种序列化导致的报错
    • 故障排除四:解决算子函数返回NULL导致的问题
    • 故障排除五:解决YARN-CLIENT模式导致的网卡流量激增问题
    • 故障排除六:解决YARN-CLUSTER模式的JVM栈内存溢出无法执行问题
    • 故障排除七:解决SparkSQL导致的JVM栈内存溢出
    • 故障排除八:持久化与checkpoint的使用
    • 运行资源调优、JVM虚拟机优化
    • Spark的内存管理优化、GC优化
    • 京东商城基于Spark的风控系统的实现
    • Spark在美团的实践
  • 25数据结构(一)
    • 数据结构和算法基本介绍
    • 数据结构和算法几个实际问题
    • 稀疏数组介绍
    • 稀疏数组压缩实现
    • 稀疏数组解压实现
    • 队列介绍
    • 单向队列实现
    • 单向队列问题分析
    • 环形队列
  • 26数据结构(二)
    • 链表说明和应用场景
    • 单向链表-人员管理系统说明
    • 单向链表-添加和遍历
    • 单向链表-有序插入节点
    • 单向链表-修改节点
    • 单向链表-删除节点
    • 双向链表基本介绍
    • 双向链表的实现
    • 链表的经典应用-约瑟夫问题
  • 27数据结构(三)
    • 约瑟夫问题-形成环形和遍历
    • 约瑟夫问题-算法思路分析
    • 约瑟夫问题-算法的实现
    • 栈的基本介绍
    • 栈的基本使用
    • 使用栈计算表达式的思路
    • 编写数栈和符号栈
    • 完成单数表达式运算
    • 递归的应用(迷宫回溯)
  • 28数据结构(四)
    • 递归的机制分析
    • 递归能解决的问题
    • 迷宫解决思路和创建地图
    • 递归回溯解决迷宫问题
    • 冒泡排序
    • 选择排序分析和实现
    • 插入排序的思路分析
    • 插入排序的实现
    • 快速排序思路分析
  • 29数据结构(五)
    • 快速排序代码实现
    • 归并排序的思路分析
    • 查找的基本介绍
    • 二分查找实现和分析
    • 二分查找所有相同值
    • 哈希(散列)表实现机制分析
    • 哈希(散列)表的添加、遍历、查找
    • 树常用术语
    • 二叉树的遍历
  • 01Flink入门
    • 流处理技术的演变
    • 初识Flink
    • 批处理与流处理
    • Flink基本架构
    • JobManager与TaskManager
    • 无界数据流与有界数据流
    • 数据流编程模型
    • Flink集群搭建
    • Standalone模式安装
    • Yarn模式安装
  • 02Flink运行架构
    • 任务调度原理
    • Worker与Slots
    • 并行数据流
    • Flink架构原理
    • 事件时间处理
    • 状态管理
    • 检查点
  • 03Flink DataStream API
    • 基本转换算子
    • 键控流转换算子
    • 多流转换算子
    • 自定义UDF函数
    • 分布式转换算子
  • 04Event Time与Window
    • Time
    • Window
    • 窗口操作符
    • 自定义窗口操作符
    • 窗口生命周期
    • 窗口分配器
    • 触发器
  • 05 有状态计算
    • 一致性
    • Exactly-Once
    • 状态存储
    • 状态恢复
    • 状态清理
    • 配置检查点
    • 防止状态泄露
    • CEP

管理体系

从心出发,助你学习、求职、晋升一路顺畅!

入学
测验

科学量化开发潜力
从一开始就知道自己的特长,让学习更明确!

学习小组,自习辅导,阶段测评,个人学习分析
讲师、助教、班主任时时陪同,让你从此爱上学习!

实时教学
反馈系统
职业能
力拓展

纵向拓展专业技术,横向拓展综合实力
挤进尚硅谷,注定你优秀,不只是说说而已!

就业
指导

知名企业技术大牛分享,老学员分享
在尚硅谷,你永远不是一个人在奋斗!

尚硅谷java培训学员风采1
关于我们
名师团队
新闻动态
合作企业
资源下载
视频下载
资料下载
工具下载
加入我们
招聘岗位
岗位介绍
招贤纳师
联系我们
电话:010-56253825
邮箱:info@atguigu.com
地址:北京市昌平区宏福科技园综合楼6层(北京校区)

 深圳市宝安区西部硅谷大厦B座C区一层(深圳校区)

上海市松江区谷阳北路166号大江商厦6层(上海校区)