[筆記] Weka 強大的資料探勘軟體 -- 分類模型(上)


上一篇介紹完Weka的前處理,這裡換介紹最常用的

分類(Classify)

剛進入Classify頁面,可以很清楚看到幾個大區塊架構

分類模型(Classifier)

點擊Choose可以看到很多資料夾

常用的分類模型有(這裡的用詞方法可能跟習慣不太一樣):

貝氏分類(Bayes)
 - Naive Bayes,簡單貝氏分類

函式分類(Functions)
 - SMO,依序最佳化的支持向量機
 - Logistic,Logistic回歸

懶人法(Lazy)
 - IBK,最鄰近搜尋法
 - LBR,懶人貝氏分類

群體學習(Meta)
 - Adaboost.M1,Adaboost分類法
 - Bagging,Bagging分類法
 - Vote,多個模型整合投票

多重執行個體( Multi-Instance, MI )

混合式(Miscellaneous, Misc)

規則分類(Rules)
 - M5Rule,M5規則式演算法

決策樹(Tree)
 - J48,Weka裡頭的C4.5演算法
 - LTM,Logistic回歸模型決策樹
 - M5P,M5演算法加強版
 - Decision Stump,單層決策樹
 - Random Forest,隨機森林演算法

這邊是測試資料集的設定方式

Use Training Set:將訓練資料集,轉成測試資料集

Supplied test set:可以另外設定外來資料做測試資料集

Cross-Validation:交叉驗證,後面框框是設定幾次(一般設定都是10次)

Percentage split:將原始資料分割66%為訓練,34%為測試(這是常用的設定)


More Options:這邊可以設定輸出參數

選擇你的目標屬性特徵,如果你選擇適合你資料的演算法
就可以按下Start開始執行運算了!


右側就會顯示運算的結果啦!


左下的部份會記錄每次跑的結果
點一下左鍵,右側計算結果就會跟著改變
點一下右鍵,可以有許多設定


View in separate window:將執行結果令開一個視窗顯示

下面就是顯示一些圖表結果,其中:
Visualize Tree:當是你跑決策樹的時候,可以看到樹的樣子


提醒

本站內容即日起將轉到另一站上轉跳~