作者|Mandy Gu
編譯|Flin
來源|towardsdatascience
Logistic回歸,通過估計事件發生的對數概率來對事件發生的概率進行建模,如果我們假設對數比值和 j 個自變數之間存在線性關系,那么我們可以將事件發生的概率p建模為:

你可能注意到未指定對數底,對數的底數其實并不重要,回想一下,如果我們把兩邊都乘以logk b,我們可以把底數b改成任何新的底數k,
這使我們可以靈活地假設左側的底數,當然,底數會影響對結果和系數值的解釋,
分離概率
如果我們有估計系數,就很容易分離出p,注意,p/(1-p)表示事件發生的概率,

我們將用另一個例子來解釋說明,房地產經紀人吉姆(Jim)訓練了一個邏輯回歸模型來預測某人出價買房的可能性,他通過使用兩個解釋變數來保持他的模型的簡潔性:
-
x1:潛在客戶拜訪房子的次數
-
這棟房子的要價是幾千美元
在使用程式確定最優系數后,Jim為他的模型推匯出這些系數:

Jim的模型告訴我們:
-
潛在買家每多一次拜訪,平均概率自然對數增加2
-
房屋每增加1000美元,平均概率的自然對數下降0.002
聽起來很拗口,而且很難聽懂,我們可以用一個更簡單的技巧來解釋,

我們可以計算e的2次方和-0.002次方的值來簡化解釋,
-
潛在買家平均每增加一次造訪的時間,他提出報價的概率就會增加約7.39倍
-
房屋每增加1000美元,平均出價的概率會受到0.998倍的影響
如果吉姆的客戶,Sue,參觀了一次房子,房子價值100萬美元,那么我們可以用上面推匯出的公式來估計她購買房子的概率,

這表明Sue有大約4%的概率出價買下這所房子,
作為一個分類器
盡管logistic回歸是一種回歸模型,但它經常被用于分類,概率總是在0和1之間,我們可以設定一個任意的閾值來預測觀察到的類別,
我們還可以將logistic回歸擴展為兩個以上的分類器,使其成為一個多類分類器,為此,我們可以采取“ 一對一”的方法,即訓練盡可能多的邏輯回歸模型(每個模型預測一個類別的對數概率),并采用產生最高推斷概率的類別,
原文鏈接:https://towardsdatascience.com/data-science-crash-course-interpreting-logistic-regression-97fc0f40d06b
歡迎關注磐創AI博客站:
http://panchuang.net/
sklearn機器學習中文官方檔案:
http://sklearn123.com/
歡迎關注磐創博客資源匯總站:
http://docs.panchuang.net/
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/194803.html
標籤:其他
