第一講:R語言精要
本著循序漸進(jìn)而又覆蓋R語言重要而有用的基本內(nèi)容原則,本講從R語言入門開始,以前期的數(shù)據(jù)處理為核心,以實際案例為載體,內(nèi)容包括R語言的向量、數(shù)據(jù)框、矩陣運(yùn)算、缺失值和零值的處理、特別注重用R語言構(gòu)造函數(shù)編程解決實際問題,詳細(xì)介紹強(qiáng)大的數(shù)據(jù)清洗整理plyr、zoo、car等常用包和強(qiáng)大的作圖ggplot2包,為使用R語言進(jìn)行數(shù)據(jù)挖掘打下扎實的工具基礎(chǔ)。
主要案例:
案例1:如何用R語言合并、排序、分析數(shù)據(jù);
案例2:如何用R語言編程實現(xiàn)數(shù)據(jù)分析可視化圖片的jpeg格式輸出;
第二講:Logistic回歸與商業(yè)大數(shù)據(jù)建模
Logistic回歸是商業(yè)建模的常用重要數(shù)據(jù)挖掘方法,本講要講清楚Logistic回歸的建模原理、與多元線性模型的區(qū)別、R語言實現(xiàn)過程及回歸診斷注意事項、預(yù)測方法和結(jié)果解釋,讓學(xué)員徹底地掌握Logistic回歸解決問題的R語言方法。
2:R數(shù)據(jù)挖掘(一)
2.1 數(shù)據(jù)挖掘工業(yè)流程
2.2 先修統(tǒng)計知識
2.3 挖掘預(yù)處理
2.4 線性回歸
主要案例:
?案例1:利用Logistic回歸幫助汽車情況預(yù)測;
?案例2:利用Logistic回歸幫助州數(shù)據(jù)挖掘方案;
第三講:關(guān)聯(lián)規(guī)則和R語言實現(xiàn)
關(guān)聯(lián)規(guī)則(著名的“啤酒和尿布”)是數(shù)據(jù)挖掘的基礎(chǔ)和核心技術(shù)之一,本講將著重圍繞經(jīng)典的Apriori算法和eclat算法,闡明關(guān)聯(lián)規(guī)則的支持、置信和提升程度與控制,使用R語言快速完成關(guān)聯(lián)規(guī)則分析。
主要案例:
案例:使用R語言關(guān)聯(lián)規(guī)則方法幫助數(shù)據(jù)挖掘分析方案;
第四講:回歸決策分析和R語言實現(xiàn)
回歸是數(shù)據(jù)挖掘的經(jīng)典方法,其原理容易被理解。
主要案例:
案例:進(jìn)行回歸分析并完成相關(guān)目標(biāo)變量的預(yù)測;
|