要查找所有最高相關性,您可以根據從 Pandas 中的大型相關性矩陣中列出最高相關性對使用以下代碼?:
d = {'col1': [1, 2], 'col2': [3, 4], 'col3': [7,3]}
df = pd.DataFrame(data=d)
df.corr().unstack().sort_values().drop_duplicates()
我必須如何更改上述行才能僅將一個特定列與所有其他列進行比較?
我不想將 col2 與 col3 進行比較。只是 col1 到 col2 和 col1 到 col3 的相關性對我來說很重要。
uj5u.com熱心網友回復:
您可以首先使用 來計算完整的相關性df.corr()。之后,您可以選擇df.corr()您感興趣的相關矩陣回傳的行。
假設您對col1與其他人之間的相關性感興趣:
d = {'col1': [1, 2], 'col2': [3, 4], 'col3': [7,3]}
df = pd.DataFrame(data=d)
df.corr().loc['col1']
# col1 1.0
# col2 1.0
# col3 -1.0
# Name: col1, dtype: float64
轉載請註明出處,本文鏈接:https://www.uj5u.com/ruanti/357463.html
