
CDA_Hadoop大數據分析師培訓
大數據基礎知識
Linux及unbuntu系統基礎
Hadoop的單機和偽分布模式的安裝配置
第一階段:大數據前沿知識及Hadoop入門
預期效果:零基礎入門,了解大數據的歷史背景及發展方向,掌握Hadoop多種安裝配置
第二階段:Hadoop部署進階
1.Hadoop集群模式搭建
2. Hadoop分布式文件系統HDFS深入剖析
3.使用hdfs提供的api進行hdfs文件操作
熟練掌握Hadoop集群搭建;對Hadoop架構的分布式文件系統HDFS進行深入分析
第三階段:Java基礎及實戰
1. java程序的基本框架
2. Java的數據類型與表達式介紹
3. java程序設計的基礎
4.java的面向對象編程及方法
5.mysql數據庫基礎知識
零基礎入門,了解java程序設計的基本思想,熟練利用eclipse進行簡單的java程序設計,熟練使用jar文件,了解mysql等數據庫管理系統的原理,基于web的程序開發流程
第四階段:Mapreduce理論及實戰
1. Mapreduce概念及思想
2.mapreduce構架和流程
3.三個基于mapreduce的初級案例
4.mapreduce高級案例--人大經濟論壇日志管理
熟悉Mapreduce的工作原理及應用,熟悉基本的Mapreduce程序設計,掌握根據大數據分析的目標設計和編寫基于Mapreduce的項目
第五階段:Hadoop+Mahout大數據分析
1. mahout學習之簡介、安裝及配置
2. 六個實戰案例深入解析hadoop+mahout的大數據分析之分類、聚類與主題推薦
掌握基于hadoop+mahout的大數據分析方法的使用場景,熟練運用mahout的成熟算法進行特定場景的大數據分析
第六階段:Hbase Spark理論及實戰
1. hbase簡介、安裝及配置
2. hbase實戰
掌握hbase的數據存儲及項目實戰,Spark、Hive的安裝、配置及使用場景
第七階段:Hadoop+Spark大數據分析
實戰案例深入解析Hadoop+Spark的大數據分析之分類、Logistic回歸與主題推薦
掌握基于hadoop+Spark的大數據分析方法的使用場景,熟練運用Spark的成熟算法進行特定場景的大數據分析