簡答題：

簡答題：
- 1、請簡述人工智能和機器學習，深度學習的關系？
- 2、根據資料集組成不同，通常可以把機器學習演算法分為哪四類？
- 3、請簡述什么是監督學習？什么是無監督學習？
- 4、請簡述什么是機器學習？
- 5、機器學習作業流程有哪五步？
- 6、請簡述什么是特征工程？
- 7、請簡述特征工程主要包含什么內容？
- 8、請簡述什么是特征提取？
- 9、請簡述什么是特征預處理？
- 10、請簡述什么是特征降維？
- 11、分類模型評估的主要評價指標有哪些？
- 12、回歸模型評估的主要評價指標有哪些？
- 13、簡要說明什么是超引數？
- 14、超引數和模型引數有什么不同?
- 15、什么情況我們需要對資料進行歸一化處理？歸一化的作用什么？
- 16、常用的歸一化的方法有哪兩個？分別適用的情況是什么？
- 17、簡述K-近鄰演算法的優點和缺點，
- 18、什么是線性回歸？它的特點是什么？
- 19、線性回歸中的梯度下降和正規方程方法有什么不同？
- 20、常見的梯度下降演算法有哪些？
- 21、簡述欠擬合原因以及解決辦法，
- 22、簡述過擬合原因以及解決辦法，
- 23、什么是正則化？正則化類別有哪兩種？
- 24、什么是精確率？
- 25、什么是召回率？
- 26、簡述 k-means聚類演算法實作的步驟，
- 27、簡述一下K-means演算法的優點，
- 28、簡述一下K-means演算法的缺點，
- 29、在聚類演算法中什么是降維？它有哪兩種形式？
- 30、在聚類演算法中什么是主成分分析(PCA)？
- 31、在聚類演算法中主成分分析(PCA)的作用是什么？

1、請簡述人工智能和機器學習，深度學習的關系？

機器學習是人工智能的一個實作途徑，深度學習是機器學習的一個方法發展而來

2、根據資料集組成不同，通常可以把機器學習演算法分為哪四類？

監督學習、無監督學習、半監督學習、強化學習

3、請簡述什么是監督學習？什么是無監督學習？

監督學習的輸入資料是由輸入特征值和目標值所組成，無監督學習輸入資料是由輸入特征值組成，沒有目標值，

4、請簡述什么是機器學習？

機器學習是從資料中自動分析獲得模型，并利用模型對未知資料進行預測，

5、機器學習作業流程有哪五步？

1.獲取資料
2.資料基本處理
3.特征工程
4.機器學習(模型訓練)
5.模型評估
結果達到要求就上線服務，如果沒有達到要求，重新上面步驟

6、請簡述什么是特征工程？

特征工程是使用專業背景知識和技巧處理資料，使得特征能在機器學習演算法上發揮更好的作用的程序，

7、請簡述特征工程主要包含什么內容？

特征提取、特征預處理、特征降維，

8、請簡述什么是特征提取？

將任意資料（如文本或影像）轉換為可用于機器學習的數字特征，

9、請簡述什么是特征預處理？

通過一些轉換函式將特征資料轉換成更加適合演算法模型的特征資料程序，

10、請簡述什么是特征降維？

指在某些限定條件下，降低隨機變數(特征)個數，得到一組“不相關”主變數的程序，

11、分類模型評估的主要評價指標有哪些？

準確率、精確率、召回率、F1-score、AUC指標等

12、回歸模型評估的主要評價指標有哪些？

均方根誤差（RMSE）、相對平方誤差（RSE）、平均絕對誤差（MAE)、相對絕對誤差（RAE)

13、簡要說明什么是超引數？

超引數就是在運行機器學習演算法之前需要指定值的引數

14、超引數和模型引數有什么不同?

超引數：指在演算法運行前需要指定的引數
模型引數：指演算法程序中學習的引數

15、什么情況我們需要對資料進行歸一化處理？歸一化的作用什么？

我們在訓練模型時，如果特征之間的值差距較大，不能直接傳入模型，就需要對資料做歸一化處理，
作用：將所有資料映射到同一尺度，

16、常用的歸一化的方法有哪兩個？分別適用的情況是什么？

1.最值歸一化(Normalization)：

把所有資料映射到(0,1)之間，
適用情況：分布有明顯邊界

2.均值方差歸一化(standardization)：

把所有資料歸一到均值為0方差為1的分布中，
適用情況：資料分布沒有明顯邊界

17、簡述K-近鄰演算法的優點和缺點，

優點：
1.天然能夠解決多分類問題；
2.思想簡單，效果強大；
3.使用k-近鄰演算法還可以解決回歸問題

缺點：
1.效率低下、時間復雜度高；
2.高度資料相關；
3.預測結果不具有可解釋性
4.維數災難

18、什么是線性回歸？它的特點是什么？

線性回歸是利用回歸方程(函式)對一個或多個自變數(特征值)和因變數(目標值)之間關系進行建模的一種分析方式，

特點：只有一個自變數的情況稱為單變數回歸，多于一個自變數情況的叫做多元回歸，

19、線性回歸中的梯度下降和正規方程方法有什么不同？

1.梯度下降需要選擇學習率，正規方程不需要
2.梯度下降需要迭代求解，正規方程一次運算得出結果
3.梯度下降在特征數量較大也可以使用，正規方程因為需要計算方程，時間復雜度高O(n3)

20、常見的梯度下降演算法有哪些？

全梯度下降演算法，隨機梯度下降演算法，小批量梯度下降演算法，隨機平均梯度下降演算法，

21、簡述欠擬合原因以及解決辦法，

原因：學習到資料的特征過少
解決辦法：
1）添加其他特征項，
2）添加多項式特征

22、簡述過擬合原因以及解決辦法，

原因：原始特征過多，存在一些嘈雜特征，模型過于復雜是因為模型嘗試去兼顧各個測驗資料點，
解決辦法：
1）重新清洗資料，
2）增大資料的訓練量，
3）正則化
4）減少特征維度，防止維度災難

23、什么是正則化？正則化類別有哪兩種？

在學習的時候，資料提供的特征有些影響模型復雜度或者這個特征的資料點例外較多，所以演算法在學習的時候盡量減少這個特征的影響（甚至洗掉某個特征的影響），這就是正則化，
有L1正則化（Ridge回歸）和L2正則化（LASSO回歸），

24、什么是精確率？

預測結果為正例樣本中真實為正例的比例

25、什么是召回率？

真實為正例的樣本中預測結果為正例的比例（查得全，對正樣本的區分能力）

26、簡述 k-means聚類演算法實作的步驟，

1）隨機設定K個特征空間內的點作為初始的聚類中心，
2）對于其他每個點計算到K個中心的距離，未知的點選擇最近的一個聚類中心點作為標記類別，
3）接著對著標記的聚類中心之后，重新計算出每個聚類的新中心點（平均值），
4）如果計算得出的新中心點與原中心點一樣（質心不再移動），那么結束，否則重新進行第二步程序

27、簡述一下K-means演算法的優點，

1）原理簡單（靠近中心點），實作容易，
2）聚類效果中上（依賴K的選擇），
3）空間復雜度o(N)，時間復雜度o(IKN) ，N為樣本點個數，K為中心點個數，I為迭代次數，

28、簡述一下K-means演算法的缺點，

答案：
1）對離群點，噪聲敏感（中心點易偏移），
2）很難發現大小差別很大的簇及進行增量計算，
3）結果不一定是全域最優，只能保證區域最優（與K的個數及初值選取有關），

29、在聚類演算法中什么是降維？它有哪兩種形式？

降維：在某些限定條件下，降低隨機變數(特征)個數，得到一組“不相關”主變數的程序，
兩種形式：特征選擇和主成分分析，

30、在聚類演算法中什么是主成分分析(PCA)？

高維資料轉化為低維資料的程序，在此程序中可能會舍棄原有資料、創造新的變數，

31、在聚類演算法中主成分分析(PCA)的作用是什么？

作用是資料維數壓縮，盡可能降低原資料的維數（復雜度），損失少量資訊，

轉載請註明出處，本文鏈接：https://www.uj5u.com/qita/397547.html

標籤：AI

上一篇：因子分析（R實體）

下一篇：人工智能導論期末復習合集

機器學習 簡答題 速記