沈阳大数据培训中心

大数据是各国抢占新一轮经济和科技发展制高点的战略选择,实力技术人才遭到企业疯抢,学习大数据,就业口径宽广,"钱途"无量!通过构建在实时数仓之上的用户画像和推荐系统将数据与算法融合,学员真正完成企业级大数据应用学习。重新定义大数据高级培训,开启大数据架构师进阶之路。


有政策支持

行业前景广

人才缺口大

平均月薪高


专业教研团队
为提高课程前瞻先导性,及与企业无缝对接,对市场进行阶段性调研,专人专职提高课程科学性。

严格考核机制
学员入学需严格测试,入班后每周小测、阶段大测,通过严格考核,了解学员对知识的掌握情况。
企业技术老师
特聘请原新浪、国企等大数据负责人,从技术角度讲述实战项目,吊打其他机构初级授课讲师。

学习硬件支撑
课程项目与企业无缝对接,重金采购10台集群与服务器提供硬件支撑,拒绝虚拟小作坊式学习。



- 第一阶段 JavaSE
主题 主要内容 Java基础语法 计算机理论介绍编程基础--进制分类,进制转换等JDK的安装与环境变量的配置注释数据类型标识符变量和常量转义字符数据类型转换常用运算符分支流程控制-if分支流程控制-switch循环流程控制-while循环流程控制-for方法的定义与调用方法的参数与返回值方法的重载方法的递归数组的定义与元素访问数组的内存分析数组的常见操作数组排序Java面向对象 面向对象与面向过程类的设计对象的实例化对象的内存分析类中成员的访问类是一种自定义的类型this关键字包(package)的创建与使用构造方法private关键字与属性封装单例设计模式继承基本的概念继承中的特点继承中的构造方法方法的重写final关键字super关键字的使用Object类对象的转型instanceof关键字抽象类与抽象方法接口常用类、异常、集合 Lambda表达式内部类包装类型常用类Random、Date、SimpleDateFormat、Calendar枚举异常定义常用结构.finally关键的应用自定义异常String类常用方法StringBuffer/StringBuilder的常用方法正则表达式集合框架Collection集合中元素排序Collections工具类泛型集合框架MapHashMap集合TreeMap集合可变参数Arrays工具类基本数据结构Java多线程和IO 多线程概念并发与并行创建线程的方式线程常用方法线程生命周期临界资源问题同步代码段synchronized关键字同步方法synchronized关键字lock和unlock线程死锁生产者消费者设计模式(一对一)懒汉式单例设计模式中的线程安全问题File常用方法流的基础流的分类字节流字符流转换流缓冲流对象流Properties文件操作NIO和NIO.2(缓冲区、通道、Paths.get、Files)Class类Class获取对象的三种方式Constructor构造方法Field 属性Method方法反射实例MySQL+JDBC SQL简介SQL表的概念数据库的安装卸载登录MySQL和MySQL常用命令MySQL中常用的基本数据类型数据库DDL操作数据库DML操作 数据库DQL操作数据库DQL操作数据完整性数据库的索引操作表与表之间的关系多表查询常见函数应用数据备份与恢复JDBC原理JDBC的实现JDBC实例-模拟登陆SQL注入问题xml和json讲解数据库事务连接池连接池原理常用的三方连接池DBCP、C3P0和DruidDBUtils三方工具的使用 - 第二阶段 Hadoop生态
主题 主要内容 Linux和Shell脚本 CentOS 7.7安装部署
常见文件操作命令
常用系统操作命令
常用的四种软件安装部署
Shell脚本中变量
Shell脚本数组、if-el分支、循环和方法等
Shell脚本调试
crontab定时器HDFS分布式文件系统 HDFS组件概述
Hadoop安装部署
HDFS中的服务功能
HDFS工作机制
HDFS读写流程
HDFS的api操作Zookeeper Zookeeper的定义
Zookeeper的应用场景
Zookeeper的服务及功能
Zookeeper整体架构
Zookeeper的选举机制
Zookeeper中事务
Zookeeper安装部署
Zookeeper操作
HDFS的HA部署MapReduce YARN的组件
YARN的架构
YARN的调度方式
YARN工作原理
MapReduce模型
MapReduce中shuffle机制
MapReduce中的partitioner
MapReduce中的自定义输入输出
MapReduce中的join操作
MapReduce中的压缩
MapReduce优化Hive Hive架构
Hive安装部署
Hive的DDL操作
Hive的DML操作
Hive分区
Hive分桶
Hive数据加载
Hive中数据类型
Hive的常见内部函数
Hive自定义函数(UDF|UDAF)
Hive视图
Hive索引
Hive优化Presto Presto部署
Presto命令行接口
Presto的JDBC驱动
Presto队列配置
Presto的连接器
Presto的函数和运算符
Presto的数据类型
Presto的sql操作
Presto从Hive迁移
Presto的函数Hbase Hbase架构
Hbase组件
Hbase工作原理
Hbase的shell操作
Hbase的api操作
Hbase的合并
Hbase的触发器
Hbase的过滤器
Hbase的RowKey设计
Hbase的优化操作Phoenix Phoenix安装部署
Phoenix的四种操作方式
Phoenix的DDL和DML
Phoenix的视图
Phoenix的二级索引
Phoenix的分页实现Kylin Kylin架构
Kylin安装部署
Kylin数据源添加
Kylin的Mode创建
Kylin的Cube构建
Kylin的Cube运行
Kylin的支持的操作
Kylin的优化Sqoop Sqoop架构
Sqoop安装部署
Sqoop的工作原理
Sqoop的Import和Export
Sqoop增量和全量操作
Sqoop元数据
Sqoop的Job操作
Sqoop代码脚本化Flume Flume架构
Flume安装部署
Flume的source、channel、sink
Flume的selector使用
Flume的实时采集
Flume自带拦截器和自定义拦截器
Flume多agent部署
Flume的容错Azkaban Azkaban架构
Azkaban部署
Azkaban的Shell案例
Azkaban的MapReduce案例
Azkaban的Hive案例
Azkaban的Sqoop案例
Azkaban的定时案例
Azkaban的2.0语法
Azkaban的用户和权限
Azkaban的优化Git Git相关概念
Git安装部署
Git命令行操作
Git版本库创建
Git中分支操作
Git冲突解决
GitHub和GitLab介绍使用
Git和IDEA整合使用数据仓库 数据仓库定义
数据仓库四大特征
数据仓库主题
数据仓库集市
数据粒度
数据仓库中维度
数据仓库中缓慢数据变化处理
数据仓库分层 - 第三阶段 Spark生态
主题 主要内容 Scala基础 Scala环境部署
编码规范
var和val的区别
数据类型
表达式
循环
定义方法和函数
数组(Array)
映射(Map)
元组(Tuple)
列表(List)
Set
集合的重要函数
类、特质、抽象类、对象、继承
模式匹配和样例类
高阶函数
隐式转换和隐示参数
泛型
Netty的概念Spark Core Spark简介
Spark运行模式
SparkShell
RDD的概念详解
Transformation算子
Action算子
DAG有向无环图
RDD任务的切分
Lineage(血统)
Checkpoint检查点机制
Spark集群启动流程和任务提交流程
自定义排序
自定义分区
Accumulator累加器
Broadcast广播变量
Shuffle原理剖析与源码分析
SparkSubmit执行流程
集群启动流程详解
SparkContext执行流程
Task提交流程详解
Stage划分过程详解Spark内核源码 Spark启动脚本解析
Spark提交流程解析
应用提交和Driver进程
SparkContext解析
Spark executor解析
Spark的部署模式
Spark的shuffle流程
Spark的内存管理Spark SQL SparkSQL介绍
SparkSQL的操作方式
SparkSQL的数据抽象
Spark-shell基本操作
数据转换(RDD,DataFrame,DataSet)
数据操作方法(DSL和SQL)
SparkSQL自定义函数(UDF,UDAF,开窗函数)
Spark集成Hive(内置Hive和外置Hive)Kafka消息队列 Kafka的组件介绍
Kafka集群部署
Kafka文件存储机制
topic中partitioner的分布
Kafka分区中的Segment
Kafka分区和消费者的关系
kafka日志合并
kafka的生产者案例
Kafka的消费者案例
Kafka自定义分区器
Kafka消费者组
Zookeeper如何管理KafkaRedis Redis的应用场景
Redis安装部署
Redis数据类型的cli和api操作
Redis的数据类型和操作案例
Redis主从复制
Redis集群部署
Redis的连接池
Redis中的雪崩、穿透和击穿问题Spark Streaming Spark Streaming的原理介绍
DStream的概念
DStream原语类型介绍
DStream的Transformation(转换)、Output(输出)
窗口操作案例实现
Spark Streaming结合Kafka案例实现
背压和反压机制
如何保证数据的一致性
Structured Streaming实战Spark Mllib Spark MLlib简介
Spark MLlib组件介绍
Word2Vec
TF-IDF
ALS
GBDT
LR
MinMaxScaler
OneHotEncoderElasticsearch Elasticsearch的相关概念
Elasticsearch及插件安装部署
Index的概念
Document的概念
Mapping映射的概念
Elasticsearch的数据类型
Elasticsearch的聚合操作
索引rest和api相关操作
Elasticsearch的SQL操作
Elasticsearch过滤器
IK分词器集成Elasticsearch
查询文档分页操作
Kibana插件操作ClickHouse ClickHouse概念
ClickHouse安装部署
客户端连接和JDBC方式访问ClickHouse
数据类型
ClickHouse的ddl和dml操作
ClickHouse表引擎
ClickHouse优化 - 第四阶段 Flink生态
主题 主要内容 Flink基础 Flink部署模式
Flink Streaming DataStream API介绍
Flink Streaming DataSource、Transformations、Sink详解
Flink的connector
Flink的自定义输入输出
Flink中两阶段提交
Flink中的操作链
Flink DataSet的DataSource、Transformations、Sink详解
Flink Table API和SQL应用
Blink Table的操作
Sql与hive的整合
Flink的序列化
Flink的广播变量
Flink的累加器
Flink的分布式缓存
Flink的状态管理和恢复
Flink的CheckPoint
Flink失败重启
Flink中Time
Flink窗口
EventTime与Watermarks
Flink的CEP
Flink的新特性
Flink的优化


就业复盘
统计数千名毕业老学员所在公司使用到的实际企业技术及学员大厂面试反馈。
辅导职业素养
提升职业素养及职业能力,掌握企业生存的法则,提升级职场竞争力,激发潜能。
技术提升服务
老学员可享技术提升,根据市场需求课程实时更新发布,企业主流技术。