生成虛擬資料

np.random.seed(42)
df = pd.DataFrame({'subject': ['A'] * 10   ['B'] * 10,
                   'trial': list(range(5)) * 4,
                   'value1': np.random.randint(0, 100, 20),
                   'value2': np.random.randint(0, 100, 20)
                   })
df = df.set_index(['subject', 'trial']).sort_index()
print(df)


               value1  value2
subject trial                
A       0          51       1
        0          20      75
        1          92      63
        1          82      57
        2          14      59
        2          86      21
        3          71      20
        3          74      88
        4          60      32
        4          74      48
B       0          87      90
        0          52      79
        1          99      58
        1           1      14
        2          23      41
        2          87      61
        3           2      91
        3          29      61
        4          21      59
        4          37      46

注意：每個主題/試驗組合都有多行。

我想創建一個以行作為嵌套維度的陣列。

我的（因為我覺得很難看）通過串列進行資料轉換

tmp=list()
for idx in df.index.unique():
   tmp.append(df.loc[idx].to_numpy())
goal = np.array(tmp)
print(goal)


[[[51  1]
  [20 75]]

...

 [[21 59]
  [37 46]]]

你能告訴我一個原生的pandas / numpy 方法嗎（沒有串列拐杖）？

uj5u.com熱心網友回復：

為了能夠生成非參差不齊的 numpy 陣列，所有值的重復數必須相等。因此，您不必遍歷它們。只需找出號碼和reshape

n = len(df)/(~df.index.duplicated()).sum()

assert n.is_integer()

out = df.to_numpy().reshape(-1, df.shape[1], int(n))

輸出：

array([[[51,  1],
        [20, 75]],

       [[92, 63],
        [82, 57]],

       [[14, 59],
        [86, 21]],

       [[71, 20],
        [74, 88]],

       [[60, 32],
        [74, 48]],

       [[87, 90],
        [52, 79]],

       [[99, 58],
        [ 1, 14]],

       [[23, 41],
        [87, 61]],

       [[ 2, 91],
        [29, 61]],

       [[21, 59],
        [37, 46]]])

uj5u.com熱心網友回復：

您可以使用堆疊：

<code>df.stack().values
</code>
Output:
<code>array([[ 0, 25],
       [16, 11],
       [49, 87],
       [38, 77],
       [67,  6],
       [27, 27],
       [40,  0],
       [22, 81],
       [83, 89],
       [36, 55],
       [41,  1],
       [13, 74],
       [88, 61],
       [85, 73],
       [55, 66],
       [44, 82],
       [20, 30],
       [82, 69],
       [37, 71],
       [30, 16],
       [81, 96],
       [ 0, 56],
       [ 5, 99],
       [73, 86]], dtype=int64)
</code>

轉載請註明出處，本文鏈接：https://www.uj5u.com/houduan/516079.html

標籤：熊猫麻木的

上一篇：遍歷Pandas資料框和字典項

下一篇：根據具有多個元素選擇的另一個串列過濾串列

為pandasMultiIndexDataFrame中的所有唯一索引創建嵌套陣列

生成虛擬資料

我的（因為我覺得很難看）通過串列進行資料轉換