這系列的題目來源于周曉飛老師期末發的題庫,自留做復習用的🎉 🎉 🎉 加油加油!
目錄
- 單選題19
- 單選題20
- 單選題23
- 簡答題21
- ID3
- C4.5
- CART
- 計算題5
- ID3
- C4.5
- CART
知識點可以參考博主的這篇文章
【一起入門MachineLearning】中科院機器學習第*課-非線性分類:決策樹
單選題19

- A:非純度用來描述決策樹的分類結果,非純度越大說明分類結果越不好,所以非純度應該是越小越好,等于0代表只有1類,使我們期待的結果,A錯誤,
- B:資訊增益是用來描述“熵變小”的指標,資訊增益越大,說明熵下降得越快,非純度越小,因此資訊增益越大越好,B正確,
- C:資訊增益率是為了解決資訊增益會導致傾向于選擇種類多的特征屬性的缺點,本質上也還是描述“熵變小”,所以和資訊增益一樣,也是越大越好,C錯誤,
- D:基尼指數越小越好,D錯誤,
總結:
- 非純度要盡可能小
- 熵,基尼指數(Gini Index)和分類誤差的值盡可能小
- 資訊增益/資訊增益率盡可能大(資訊增益描述熵下降的程度)
- 基尼指數盡可能小
- ID3 C4.5要求越大越好,CART要求越大越好
單選題20

- 決策樹策略:最大資訊增益,最大資訊增益率,最小基尼指數,D正確,
單選題23

- 決策樹剪枝的目的是減少樹結點使其變為一棵盡可能簡單的樹,樹的深度越低也意味著搜索時間越短,越高效,正確答案是C,
- 此外說一句題外話,根據單選題的做題技巧,答案A和答案C是相反的答案,其中必有一個正確答案,
簡答題21

ID3

C4.5

CART

計算題5


按照上一個簡答題整理的公式直接計算就行
ID3



C4.5


紅色數值表示和老師提供的標準答案不一樣,但是和同學對過答案了,我合理懷疑答案有問題,
CART


CART這一塊老師給的答案多少有點匪夷所思了,我保留我自己計算的答案,
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/397315.html
標籤:AI
