資料科學速成班：解釋邏輯回歸-有解無憂

作者|Mandy Gu
編譯|Flin
來源|towardsdatascience

Logistic回歸，通過估計事件發生的對數概率來對事件發生的概率進行建模，如果我們假設對數比值和 j 個自變數之間存在線性關系，那么我們可以將事件發生的概率p建模為：

你可能注意到未指定對數底，對數的底數其實并不重要，回想一下，如果我們把兩邊都乘以logk b，我們可以把底數b改成任何新的底數k，

這使我們可以靈活地假設左側的底數，當然，底數會影響對結果和系數值的解釋，

如果我們有估計系數，就很容易分離出p，注意，p/(1-p)表示事件發生的概率，

我們將用另一個例子來解釋說明，房地產經紀人吉姆(Jim)訓練了一個邏輯回歸模型來預測某人出價買房的可能性，他通過使用兩個解釋變數來保持他的模型的簡潔性:

在使用程式確定最優系數后，Jim為他的模型推匯出這些系數:

Jim的模型告訴我們:

聽起來很拗口，而且很難聽懂，我們可以用一個更簡單的技巧來解釋，

我們可以計算e的2次方和-0.002次方的值來簡化解釋，

如果吉姆的客戶，Sue，參觀了一次房子，房子價值100萬美元，那么我們可以用上面推匯出的公式來估計她購買房子的概率，

這表明Sue有大約4%的概率出價買下這所房子，

盡管logistic回歸是一種回歸模型，但它經常被用于分類，概率總是在0和1之間，我們可以設定一個任意的閾值來預測觀察到的類別，

我們還可以將logistic回歸擴展為兩個以上的分類器，使其成為一個多類分類器，為此，我們可以采取“ 一對一”的方法，即訓練盡可能多的邏輯回歸模型（每個模型預測一個類別的對數概率），并采用產生最高推斷概率的類別，

原文鏈接：https://towardsdatascience.com/data-science-crash-course-interpreting-logistic-regression-97fc0f40d06b

歡迎關注磐創AI博客站：
http://panchuang.net/

sklearn機器學習中文官方檔案：
http://sklearn123.com/

歡迎關注磐創博客資源匯總站：
http://docs.panchuang.net/

轉載請註明出處，本文鏈接：https://www.uj5u.com/qita/194803.html

標籤：其他