K臨近演算法
演算法原理:相似度較高的資料樣本,在映射到n維空間后,距離要比相似度較低的樣本近
分類問題:將最近的類別數量最多的作為預測結果
回歸問題:將最近的點的均值作為預測結果
超引數:在訓練模型之前,人為的指定的引數,且會對演算法產生較大影響。不同于演算法的內部引數,演算法內部引數是由模型訓練決定的。可用網格交叉驗證的方式找出最優超引數
K值:K值大小會直接影響模型結果,K值過小,模型敏感性較強,但容易導致模型過擬合。K值過大模型敏感性較弱,容易導致模型欠擬合。
過擬合:模型過于復雜,將訓練集中偶然及誤差較大的示例也擬合進去,學習到了很多無用特征。訓練集效果特別好,驗證集效果很差。
欠擬合:模型過于簡單,訓練樣本被提取的特征太少,導致訓練效果不佳。
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/221003.html
標籤:機器視覺
上一篇:機器學習
下一篇:【新手求救】python閃退
