我有一個包含 10,000 行的資料集,每行有 248 個值,這些值確定該行是零還是一。我想弄清楚為什么會這樣。我試圖從
LR = LogisticRegression(random_state=0, solver='lbfgs', multi_class='ovr',fit_intercept=True).fit(X, Y)
所以我可以理解為什么它們被分類成它們的樣子。但我不知道如何做到這一點,我不能使用散點圖,因為 x 資料比標簽資料有更多的價值。
我的問題是我將如何繪制這個。
uj5u.com熱心網友回復:
我可以建議使用繪制邏輯回歸
import seaborn as sns
sns.regplot(x='target', y='variable', data=data, logistic=True)
但這需要單個變數輸入。由于您試圖找到與大量輸入的相關性,我會首先尋找特征重要性,運行這個
from sklearn.linear_model import LogisticRegression
m = LogisticRegression()
m.fit(X, y)
print(m.coef_)
接下來的步驟是應用 PCA 來消除某些特征或將它們壓縮為更少的變數并運行相關矩陣。
PS 零或一代表什么?
轉載請註明出處,本文鏈接:https://www.uj5u.com/yidong/394387.html
