
機器學習及Python應用培訓
機器學習及Python應用
第1講 機器學習引論
(1) 什么是機器學習
(2) 機器學習的分類與術(shù)語
(3) 案例:垃圾郵件過濾;手寫體數(shù)字識別;圖像識別;自動駕駛
第2講 Python語言快速入門
(1) Why Python?
(2) 安裝Python與Spyder
(3) Python的模塊(module)
(4) Python的對象(str, bool, list, tuple, dict, set)
(5) Python的函數(shù)(function)與方法(method)
(6) Numpy(ndarray), pandas(Series, DataFrame)
(7) sklearn(機器學習)與keras(深度學習)
(8) Python畫圖(Matplotlib, pandas, seaborn)
(9) Python面向?qū)ο缶幊?/p>
第3講 數(shù)學回顧
(1) 梯度向量
(2) 方向?qū)?shù)
(3) 梯度下降
(4) 向量微分
(5) 優(yōu)化
第4講 線性回歸
(1) OLS
(2) 過擬合與泛化能力
(3) 偏差與方差的權(quán)衡
(4) 交叉驗證
(5) Python案例:多項式回歸的過擬合;波士頓房價
第5講 邏輯回歸
(1) Logit
(2) 幾率比
(3) 靈敏度與特異度
(4) ROC與AUC
(5) 科恩的kappa
(6) Python案例:泰坦尼克號旅客的存活
第6講 多項邏輯回歸
(1) 多項Logit
(2) Python案例:識別玻璃類別
第7講 判別分析
(1) 線性判別分析(Linear Discriminant Analysis)
(2) 二次判別分析(Quadratic Discriminant Analysis)
(3) 費雪判別分析(Fisher Discriminant Analysis)
(4) Python案例:鳶尾花品種的歸類
第8講 樸素貝葉斯
(1) 樸素貝葉斯(Naive Bayes)
(2) 拉普拉斯修正(Laplacian Correction)
(3) Python案例:垃圾郵件的識別
第9講 懲罰回歸
(1) 高維回歸的挑戰(zhàn)
(2) 嶺回歸(Ridge Regression)
(3) 套索估計(Lasso)
(4) 彈性網(wǎng)估計(Elastic Net)
(5) Python案例:前列腺癌的影響因素
第10講 K近鄰法
(1) 回歸問題的K近鄰法
(2) 分類問題的K近鄰法
(3) Python案例:摩托車撞擊實驗數(shù)據(jù);鳶尾花品種的歸類;威斯康辛乳腺癌的診斷
第11講 決策樹
(1) 分類樹(Classification Tree)
(2) 分裂準則(錯分率、基尼指數(shù)、信息熵)
(3) 成本復雜性修枝
(4) 回歸樹(Regression Tree)
(5) Python案例:波士頓房價;葡萄牙銀行市場營銷
第12講 隨機森林
(1) 集成學習(Ensemble Learning)
(2) 裝袋法(Bagging)
(3) 隨機森林(Random Forest)
(4) 變量重要性(Variable Importance)
(5) 偏依賴圖(Partial Dependence Plot)
(6) Python案例:波士頓房價;聲吶信號的分類
第13講 提升法
(1) 自適應提升法 (AdaBoost)
(2) AdaBoost的統(tǒng)計解釋
(3) 梯度提升法 (Gradient Boosting Machine)
(4) XGBoost算法
(5) Python案例:波士頓房價;過濾垃圾郵件;識別玻璃類別
第14講 支持向量機
(1) 大間隔分類器(Maximal Margin Classifier)
(2) 軟間隔分類器(Soft Margin Classifier)
(3) 支持向量機(Support Vector Machine)
(4) 核技巧(Kernel Trick)
(5) 支持向量回歸(Support Vector Regression)
(6) Python案例:模擬數(shù)據(jù);過濾垃圾郵件;識別手寫數(shù)字;波士頓房價
第15講 人工神經(jīng)網(wǎng)絡
(1) 人工神經(jīng)網(wǎng)絡的思想
(2) 感知機(Perceptron)
(3) 前饋神經(jīng)網(wǎng)絡(Feedforward Neural Network)
(4) 激活函數(shù)(Activation Function)
(5) 反向傳播算法(Back-propagation Algorithm)
(6) 隨機梯度下降(Stochastic Gradient Descent)
(7) 神經(jīng)網(wǎng)絡的過擬合與正則化
(8) 卷積神經(jīng)網(wǎng)絡(Convolution Neural Network)
(9) 深度學習的發(fā)展
(10) Python案例(sklearn與Keras):
波士頓房價;過濾垃圾郵件;模擬數(shù)據(jù);路透社新聞主題分類,手寫數(shù)字數(shù)據(jù)集MNIST
第16講 非監(jiān)督學習之主成分分析
(1) 總體中的主成分分析
(2) 樣本中的主成分分析
(3) 方差分解與降維
(4) 主成分回歸(Principal Component Regression)
(5) Python案例:左右耳聽力;香港回歸的經(jīng)濟效應
第17講 非監(jiān)督學習之聚類分析
(1) K-均值聚類(K-means Clustering)
(2) 分層聚類(Hierarchical Clustering)
(3) 樹狀圖
(4) 基于相關(guān)系數(shù)的距離
(5) Python案例:模擬數(shù)據(jù);鳶尾花品種的歸類
第18講 數(shù)據(jù)科學的Python語言
(1) 何為數(shù)據(jù)科學
(2) 讀寫文件
(3) 缺失與重復數(shù)據(jù)
(4) 合并數(shù)據(jù)
(5) sklearn的管線類(pipeline class)
(6) Python案例:Kaggle泰坦尼克數(shù)據(jù)的清理
第19講(Bonus Lecture) 機器學習在經(jīng)管社科的應用