Pandas：如何使用一列中的一個值（值重復）作為另一列的標題，多次使用通配符-有解無憂

我有一個來自半結構化 csv 的具有多個輸入的資料，我試圖使用一組列（超過 500 個）中的一個（第一個）值作為包含類似標題（另外 500 行）的另一組列的標題)

閱讀后我得到了這樣的東西

import pandas as pd, numpy as np

df = pd.DataFrame({'Service': np.arange(8),
               'Ticket': np.random.rand(8),
               'Var_1': np.random.rand(8), # values column
               'Var_1_View': 'temp temp temp temp temp temp temp temp'.split(), # header of values of column
               'Var_2': np.arange(8), 
               'Var_2_View': 'pres pres pres pres pres pres pres pres'.split(),
               'Var_3': np.arange(8) * 2,
               'Var_3_View': 'shift shift shift shift shift shift shift shift'.split(),
               'D': np.arange(8) * 5,
               'Mess_3': np.random.rand(8),
               'Mess_3_View': 'id id id id id id id id'.split(),
               'E': np.arange(8)})

包含值的標題以最多 3 位數字 _# 到 _###（準確地說是超過 500）結束。帶有關于值的描述的標題以文本結尾：_View

我創建了兩個 dfs，一個包含一個不包含運算式 _View

df_headers =df.iloc[:,df.columns.str.contains('View')] # wanted headers on columns containing values
df_values =df.iloc[:,~df.columns.str.contains('View')] # headers should be replaced here

我的想法是從 df_headers 中提取第一個值作為串列，并使用 df.replace 或 df.rename，更改包含這些值的 df_values 上的標題。

我可以手動完成，但我有一個巨大的 df 具有不同的前綴和后綴，但總是使用 _View 作為對包含值的最近列的描述。

因此，如果此規則不適用（Ticket、D、E 等），我將擁有帶有新標題和列的 df_dont。

由于這是我的第一個問題，我很樂意獲得反饋，歡迎關于清晰性、解釋或任何其他積極評論。

uj5u.com熱心網友回復：

我并不完全清楚您想要實作的目標，因此這可能會關閉：

view_cols = {col for col in df.columns if col.endswith("_View")}
rename_dict = {
    col.replace("_View", ""): df[col].iat[0] for col in view_cols
}
new_cols = [col for col in df.columns if col not in view_cols]
df_new = df[new_cols].rename(columns=rename_dict)

結果：

   Service    Ticket      temp  pres  shift   D        id  E
0        0  0.623941  0.934402     0      0   0  0.644999  0
1        1  0.122866  0.918892     1      2   5  0.675976  1
2        2  0.472081  0.790443     2      4  10  0.825020  2
3        3  0.914086  0.849609     3      6  15  0.357074  3
4        4  0.684477  0.729126     4      8  20  0.010928  4
5        5  0.132002  0.673680     5     10  25  0.884599  5
6        6  0.841921  0.224638     6     12  30  0.197387  6
7        7  0.721800  0.412439     7     14  35  0.875199  7

轉載請註明出處，本文鏈接：https://www.uj5u.com/qita/369046.html

標籤：Python 熊猫数据框改名通配符

上一篇：如何旋轉Pyspark資料框

下一篇：提取Pandas中每一列的平均值