機器學習培訓模型
1、SVM
? 支持向量機(Support Vector Machine,SVM)是在分類與回歸分析中
分析數據的監督式算法。
? 結構風險小化:在對給定的數據進行逼近的精度與逼近函數的復雜性相結合
來尋求佳比例,以便取得好的泛化能力
2、Logistic regression
? 邏輯回歸的過程:面對一個回歸或者分類問題,建立代價函數,然后通過優化方法
迭代求解出優的模型參數,然后測試驗證我們這個求解的模型的好壞。
? 實際是一種分類模型,主要解決二分類問題。
3、kNN
? 用于分類時思路是:找出一個樣本的k個近鄰點,當這些鄰居中的大多數屬 于某一類別,就可以判定該樣本也屬于這一類別。
4、Decision Tree
? 決策樹算法首先對數據進行處理,利用歸納算法生成可讀的規則和決策樹,
然后使用決策對新數據進行分析。
? 一種分類算法,本質上是通過一系列規則對數據進行分類的過程。
5、Random Forest
? 1.數據的隨機性選取:從原始的數據集中采取有放回的抽樣,構造子數據集。
? 2.待選特征的隨機選取:隨機森林中的子樹的每一個分裂過程并未用到所有的待選特征,
而是從所有的待選特征中隨機選取一定的特征,之后再在隨機選取的特征中選取優的
特征
6、XGBoost
? XGBoost是GBDT(Gradient boosting Decision Tree梯度提升決策樹)算法的高效實現。
? GBDT是采用梯度下降的思想、以之前生成所有的樹為基礎使得目標函數小化