一、 Logistic回歸與Logistic函式
分類問題的標簽可以是$y\epsilon \left \{ 0,1 \right \},y\epsilon \left \{ 0,1,2 \right \},y\epsilon \left \{ 0,1,2,3,... \right \}$,對應分別為二元、三元、…分類問題,借鑒線性回歸演算法,我們希望預測樣本屬于每個標簽的概率$p\left \{ y=i \right \}$ ,而且$p\epsilon \left [ 0,1 \right ]$,將概率最大的標簽作為分類結果,這里的概率就對應為假設函式$h_\theta (x)$,與線性回歸不同,logistic回歸要求$h_\theta (x)\epsilon \left \lfloor 0,1 \right \rfloor$,于是新的$h_\theta (x)$函式的構造如下:

二、 Logistic決策邊界(decision boundary)
以二元分類為例,從假設函式中可以發現,當$\theta^Tx>0$時,概率大于0.5,因此預測y=1;反之預測y=0,$\theta^Tx=0$就是決策邊界,其展開形式為:$\theta_0x+\theta_1x+\theta_2x+...=0$,對應的邊界線如下圖所示:

這里的邊界就是一條直線,將空間劃分為兩個區域,如果是多項式回歸,那么邊界可能是下面形式:

三、 Logistic代價函式
以二元分類為例,Logistic回歸同線性回歸一樣,都要確定合適的模型引數,來更好地預測概率,同樣,使用代價函式來評價$\theta$好壞,logistic回歸里采用對數代價形式:


當所給標簽為1時,如果預測的概率接近1,則代價接近0;如果預測的概率接近0,則代價接近無窮,當所給標簽為0時,如果預測的概率接近1,則代價接近無窮;如果預測的概率接近0,則代價接近1,

四、 Logistic梯度下降
用代價函式去懲罰模型引數:

對式3-1求偏導可得:

五、 多分類問題
解決多分類的一種思想是分解為多個二分類,為每一個二分類都維護一個假設函式,記成下面的形式:

例如三分類中,我們維護三個假設函式:$h_\theta^{(0)}(x)、h_\theta^{(1)}(x)、h_\theta^{(2)}(x)$,表示屬于三個類的概率,當更新$h_\theta^{(0)}(x)$時,將標簽為0的視作0,將標簽為1、2都視作1,$h_\theta^{(1)}(x)、h_\theta^{(2)}(x)$也類似,最終預測分類的時候,比較三個假設函式值的大小,取概率最大的作為分類標準,


六、 Logistic優化演算法
除了梯度下降演算法,還有以下優化演算法,采用優化演算法,可以自動選擇合適學習率,收斂更快;一般采用這些優化演算法而非梯度下降,這里暫不深究演算法原理與實作,
1.共軛梯度演算法(conjugate gradient)
它的每一個下降方向是與上一次共軛的,其優點是所需存盤量小,收斂快,穩定性高,而且不需要任何外來引數,
下圖綠線為共軛梯度法,

2.擬牛頓法(BFGS)
牛頓法的突出優點是收斂很快,但是運用牛頓法需要計算二階偏導數,而且目標函式的Hesse矩陣可能非正定,為了克服牛頓法的缺點,人們提出了擬牛頓法,它的基本思想是用不包含二階導數的矩陣近似牛頓法中的Hesse矩陣的逆矩陣,
3.限制記憶體BFGS(L-BFGS)
在BFGS演算法中,當優化問題規模很大時,矩陣的存盤和計算將變得不可行,為了解決這個問題,就有了L-BFGS演算法,L-BFGS的基本思想是只保存最近的m次迭代資訊,從而大大減少資料的存盤空間,
七、 過擬合(overfitting)與正則化(regularization)
1.過擬合
過擬合是指當特征量較多,或特征中有高階項,而資料較少時,存在過分擬合的情況,與之相反的情況為欠擬合,這兩種情況都對預測不利,


解決過擬合的辦法一種是減少特征量,但會造成特征資訊減少;另一種是正則化,
2.回歸的正則化
對于一般地代價函式,單獨地加上對引數的懲罰,如下:

這個代價函式由兩部分組成:前部分是偏差,可以讓函式更加貼合點,后部分可以限制引數的大小,當λ取值較大,為了最小化代價,每個引數都會趨近0,最終擬合結果就是$h_\theta(x^{(i)})=0$,如果λ適當,則既可以很好地貼合資料點,又能避免過擬合現象,
回歸演算法的正則化更新方程如下,對線性回歸和邏輯回歸都適用:

一般$1-\alpha\frac{\lambda }{m}$的值非常接近1,例如0.98,對于正規方程的正則化公式如下,采用正則化的另一個好處是它能保證正規方程是一定可逆的,
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/5152.html
標籤:其他
上一篇:【讀書】4星,奧野宣之,如何有效閱讀一本書:超實用筆記讀書法
下一篇:資料分析(1)——關于平均數
