CDA大数据分析师就业班第三期视频班
第一阶段:系统基础篇
1.开学典礼及大数据概述
2.linux操作系统及
3.unbuntu系统介绍
4.JAVA基础
5.python基础
6.hadoop单机、伪分布、集群搭建
零基础入门,明确大数据的历史背景及发展方向,掌握Hadoop环境多种安装配置
重点深入hadoop集群搭建;对Hadoop架构的分布式文件系统HDFS进行深入分析
第二阶段:Hadoop生态实战篇
1.HDFS深入剖析
2.MapReduce基础理论及高级编程实战
3.Pig原理,部署与Pig Latin语言,应用案例
4.Hive体系架构、安装与HiveQL及Hive应用案例
5.Zookeeper与分布式系统开发
6.HBase体系架构,集群部署,管理
7.HBase数据模型,实战案例建模剖析
8.strom入门及部署
熟悉Hbase、 MapReduce、Hive工作原理及应用,掌握根据大数据分析的目标设计和编写基于mapreduce的项目。
动手架构真实的基于hadoop的大数据分析环境,运用hive+hbase的api操作项目实战
第三阶段:数据分析理论篇
1.SPSS软件入门
2.数据分析之统计基础(使用软件为SPSS)
3.R软件操作入门
4.数据挖掘之聚类(使用软件为R)
学到扎实的数据分析理论知识,较强的利用软件解决实际问题的能力,能胜任各行业大数据分析师工作的要求
拥有大数据分析师全面技能,数据挖掘标准流程进行项目需求分析、数据验证、建模与模型评估的能力
第四阶段:大数据分析案例篇
1.大数据可视化技术及工具简介
2.大数据背景下隐私保护及技术介绍
3.大数据的分析方法--SMART模型介绍
4.基于hadoop+Mahout的8个大数据分析案例实战
5.Spark基础原理、集群安装并运行Spark
6.Spark SQL 原理及数据整合应用
7.Spark GraphX图计算方法应用
8.Spark 推荐应用(ALS方法,FP-growth方法)
基于hadoop+Mahout算法模型和系统架构设计解析,利用Mahout提供的主题推荐算法解决人大经济论坛的主题推荐。
集群安装并运行Spark,大数据分析的瑞士军刀,利用大数据分析得出解决方案
第五阶段:毕业篇
当下,上至国家总理,下及普通庶民,大家都在关注大数据,尤其是国务院《关于印发促进大数据发展行动纲要的通知》发布,大数据已上升为国家战略。数据驱动的大数据时代到来了,你准备好了吗?正所谓机不可失,失不再来!只有站在时代的前列,只有在人们还没有觉醒之前觉醒,你才会更具竞争力。
相信你看过一些大数据相关书籍,原理知识都能理解,可是怎么应用于工作中呢?大数据分析环境怎么搭建?如果进行大数据分析?其实只要有人手把手传授你,跨入大数据分析门槛没你想象那么难!
《CDA大数据分析师就业班第三期》
课程介绍:
本课程以大数据分析师为目标,从数据分析基础、JAVA语言入门和linux操作系统入门知识学起,系统介绍Hadoop、HDFS、MapReduce和Hbase等理论知识和hadoop的生态环境,详细演示hadoop三种模式的安装配置,以案例的形式,重点讲解基于mahout项目的大数据分析之聚类、分类以及主题推荐。区别于普通的JAVA程序员,本课程的重点是培养基于Hadoop架构的大数据分析思想及架构设计,通过演示实际的大数据分析案例,使学员能在较短的时间内理解大数据分析的真实价值,掌握如何使用hadoop架构应用于大数据分析过程,使学员能有一个快速提升成为兼有理论和实战的大数据分析师,从而更好地适应当前互联网经济背景下对大数据分析师需求的旺盛的就业形势。从入门知识学起的课程体系设计和面向大数据分析师的培训理念,引导学员一步步深入学习,适合零基础学员从零学起。
Hadoop大数据分析课程给你的就是 把握时代脉博,掌握大数据时代前沿;全面掌握Hadoop的架构原理和使用场景;全面掌握Hadoop的三种架构方式及搭建过程;熟练掌握HDFS文件系统与MapReduce程序开发思想; 能利用hadoop平台进行大数据分析;能深入实际的项目案例进行大数据的实战开发;达到大数据分析师的理论和实战要求。
时间 |
课程
|
大纲简介
|
预期效果
|
第一阶段
|
大数据前沿知识及hadoop入门
|
1.大数据前沿知识介绍 2.课程介绍 3. Linux及unbuntu系统基础 4.hadoop的单机和伪分布模式的安装配置
|
零基础入门,了解大数据的历史背景及发展方向,掌握hadoop的两种安装配置
|
第二阶段
|
Hadoop部署进阶
|
1.Hadoop集群模式搭建 2. Hadoop分布式文件系统HDFS深入剖析 3.使用hdfs提供的api进行hdfs文件操作
|
熟练掌握hadoop集群搭建;对Hadoop架构的分布式文件系统HDFS进行深入分析
|
第三阶段
|
Java基础
|
1. java程序的基本框架 2. Java的数据类型与表达式介绍 3. java程序设计的基础 4.java的面向对象编程及方法 5.mysql数据库基础知识
|
零基础入门,了解java程序设计的基本思想,熟练利用eclipse进行简单的java程序设计,熟练使用jar文件,了解mysql等数据库管理系统的原理,了解基于web的程序开发流程
|
第四阶段
|
MapReduce理论及实战
|
1. Mapreduce概念及思想 2.mapreduce构架和流程 3.三个基于mapreduce的初级案例 4.mapreduce高级案例--人大经济论坛日志管理
|
熟悉MapReduce的工作原理及应用,熟悉基本的MapReduce程序设计,掌握根据大数据分析的目标设计和编写基于mapreduce的项目
|
第五阶段
|
hadoop+Mahout大数据分析
|
1. mahout学习之简介、安装及配置 2. 六个实战案例深入解析hadoop+mahout的大数据分析之分类、聚类与主题推荐
|
掌握基于hadoop+mahout的大数据分析方法的使用场景,熟练运用mahout的成熟算法进行特定场景的大数据分析
|
第六阶段
|
Hbase理论及实战 Spark、Hive的安装、配置及使用场景
|
1. hbase简介、安装及配置 2. hbase实战
|
掌握hbase的数据存储及项目实战 掌握Spark、Hive的安装、配置及使用场景
|
第七阶段
|
hadoop+Spark大数据分析
|
实战案例深入解析hadoop+Spark的大数据分析之分类、Logistic回归与主题推荐
|
掌握基于hadoop+Spark的大数据分析方法的使用场景,熟练运用Spark的成熟算法进行特定场景的大数据分析
|
师资团队
谢邦昌;台湾大学生物统计学博士,台湾著名大学天主教辅仁大学统计信息学系教授。现任中华数据挖掘协会(Chung-hua Data Mining Society,CDMS)理事长,辅仁大学统计资讯学系教授,华通人商用信息有限公司高级顾问。中国人民大学应用统计科学研究中心学术委员会委员。中国人民大学统计学系Data Mining中心客座教授,上海财经大学统计学系客座教授。厦门大学计划统计学系客座教授。西南财经大学客座教授。他是数据挖掘界领军人物及世界知名统计学家。发表过近三百篇关于统计和数据挖掘的论文。出版了近五十余本相关专著。拥有大数据分析多年行业经验。
曹正凤;软件工程专业硕士,统计学专业博士,具有多年的JAVA程序设计和统计教学经验,人大经济论坛CDA金牌讲师,研究方向为数据挖掘领域的前沿算法研究,包括随机森林算法、神经网络等内容,发表多篇论文,且发表的EI核心收录论文受到多次检索。目前致力于大数据分析前沿领域研究,主持人大经济论坛基于hadoop架构的论坛主题推荐系统项目,参与《大数据背景下基于中国烟草消费需求的供给结构分析研究》、《基于数据整合的空气质量测度方法研究》等大数据项目,并和中国人民大学院大数据中心、厦门大学大数据中心、台湾辅仁大学大数据中心有密切的联系。
辛立伟 ;Java高级软件工程师、Java高级培训讲师、认证高级讲师、系统架构师、SUN中国社区会员、JAVA技术专家。精通JAVA、JAVA EE6体系结构;精通Java企业级中间件技术设计、构建以及应用部署;畅销书《Java从初学到精通》(电子工业出版社,2010年6月)一书作者。目前专注于Java EE6、Java富互联网应用程序、Android 3G软件的研发、相关技术培训和企业咨询等。多次参与大数据分析课程教学。