我有一個由數百列組成的 pd 資料框。我想將所有列合并為一維陣列。例如,假設資料框是這樣的:
pd df:
set1 set2 set3 ... set175
3 5 6 ... 9
4 8 0 ... 22
. . . ... .
. . . ... .
而且,在連接之后我想要這樣的東西:
concatenated to 1D array:
[3,4,...,5,8,...,6,0,...,9,22]
我可能還想僅連接從第 1 列到第 3 列的一些列:
concatenated to column 1-3:
[3,4,...,5,8,...,6,0]
有什么方便的方法來做到這一點?我應該將 pd df 轉換為 numpy 陣列嗎?
到目前為止,我已經找到了使用列標題連接熊貓資料框的解決方案,這對于數百列是不實用的。在另一種方法中,使用 pd.concatenate() 連接多個資料幀的列。但是,我想連接單個資料框的列。這個問題是我目前正在處理的復雜處理的一小部分。所以,我會很感激一個簡單的答案。
uj5u.com熱心網友回復:
# stack and take the values
# choosing all columns and rows
df.T.stack().values
array([3, 4, 5, 8, 6, 0, '...', '...', 9, 22], dtype=object)
# choosing only two columns
df.T.iloc[:,1:3].stack().values
array([4, 8, 0, '...', 22], dtype=object)
轉載請註明出處,本文鏈接:https://www.uj5u.com/yidong/526151.html
標籤:Python熊猫数据框
