最近遇到一個問題,當我的訓練資料很少的時候,訓練出來的模型引數每次都不一樣,所以預測正確率一直在變化。當我的訓練集較大時,輸出變得穩定。這是一個正常現象嗎?我的模型無超引數,訓練程序也不引入隨機變數。
我的理解是,針對某些模型,比如LDA,當訓練集較小時,我們能夠得到很多種線性模型的可能性,所以造成模型引數不一。不知道這種解釋是否合理
uj5u.com熱心網友回復:
針對一些模型資料集太小的話:第一模型容易過擬合,模型不僅僅容易在訓練集上出現過擬合,也可能在驗證集上出現過擬合;第二會出現例外值,例外值可能出現在特征里,也可能出現在回應變數中,例外值也可能導致訓練樣本和測驗樣本資料分布不一致;第三就是模型很難優化。以上原因都會降低模型穩定性,但有的模型適合小樣本。uj5u.com熱心網友回復:
uj5u.com熱心網友回復:
可以用方程求解程序來類比。如果5個未知數的方程,就需要5個等式。如果給1個等式,能算出無數解,如果超過5個等式,就只會無解,或者最優解uj5u.com熱心網友回復:
謝謝!很好的類比轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/66739.html
標籤:人工智能技術
