
大數據分析原理和應用培訓
第一章 緒論
大數據的產生背景與概念
大數據的特點和技術概述
大數據的應用與價值體現
大數據時代的思維變革
第二章 開源大數據平臺
開源大數據平臺(Hadoop)
開源大數據平臺(Spark)
簡明實驗指南
第三章 Hadoop分布式文件系統——HDFS
3.1HDFS概述
3.2HDFS體系結構
3.3&3.4HDFS存儲原理與優缺點分析
補充材料:熟悉常用的HDFS操作
第四章 MapReduce并行編程模型
4.1概述
4.2MapReduce體系結構
4.3MapReduce工作流程
4.4MapReduce實例分析
4.5MapReduce編程實踐
4.6MapReduce優缺點分析
第五章 Hadoop 2.0的資源管理調度框架——YARN
5.1 YARN產生的背景 &5.2 YARN設計思路
5.3 YARN體系結構
5.4 YARN工作流程
5.5 YARN優缺點分析
第六章 大數據的獲取
6.1 網絡爬蟲基礎知識
6.2 Requests庫
6.3 Beautiful Soup庫
6.4 綜合實驗
第七章 大數據分析算法
7.1 聚類算法
7.2 分類算法
第八章 大數據分析應用
8.1大數據分析在商業中的應用(大數據營銷)
8.2 大數據分析在投資中的應用
8.3 大數據分析在保險中的應用
8.4 大數據分析在銀行中的應用