我有一張看起來像這樣的表:
| 代碼 | 年 | 月 | 值 A | 價值 B |
|---|---|---|---|---|
| 1 | 2020 | 1 | 120 | 100 |
| 1 | 2020 | 2 | 130 | 90 |
| 1 | 2020 | 3 | 90 | 89 |
| 1 | 2020 | 4 | 67 | 65 |
| ... | ... | ... | ... | ... |
| 100 | 2020 | 10 | 90 | 90 |
| 100 | 2020 | 11 | 115 | 100 |
| 100 | 2020 | 12 | 150 | 135 |
我想知道是否有辦法重新排列資料以找到每個不同代碼的 A 和 B 之間的相關性。
我在想的是,例如,為每個代碼獲取一個陣列,例如:
[(A1,A2,A3...,A12),(B1,B2,B3...,B12)]
其中 A 和 B 是相應月份的值,然后我可以看到這兩列之間的相關性。有沒有辦法讓這個動態?
uj5u.com熱心網友回復:
IIUC,您無需重新安排即可獲得每個“代碼”的相關性。相反,嘗試使用groupby:
>>> df.groupby("code").apply(lambda x: x["Value A"].corr(x["Value B"]))
code
1 0.830163
100 0.977093
dtype: float64
轉載請註明出處,本文鏈接:https://www.uj5u.com/net/454636.html
