從熊貓的資料透視表中選擇特定行-有解無憂

我有一個資料框，我現在想從資料中選擇特定的行。我在這里看到過類似的問題，例如：Selecting columns in a pandas pivot table based on specific row value? . 就我而言，我想回傳所有列，但我只想選擇特定的行。

timestamp,value
2008-03-01 00:00:00,55.0
2008-03-01 00:15:00,20.0
2008-03-01 00:30:00,13.0
2008-03-01 00:45:00,78.0
2008-03-01 01:00:00,34.0
2008-03-01 01:15:00,123.0
2008-03-01 01:30:00,25.0
2008-03-01 01:45:00,91.0
2008-03-02 00:00:00,55.0
2008-03-02 00:15:00,46.0
2008-03-02 00:30:00,66.0
2008-03-02 00:45:00,24.0
2008-03-02 01:00:00,70.0
2008-03-02 01:15:00,32.0
2008-03-02 01:30:00,15.0
2008-03-02 01:45:00,92.0

我已完成以下操作以生成以下輸出

import pandas as pd 
import numpy as np 
from datetime import datetime

df = pd.read_csv('df.csv')
df.timestamp = pd.to_datetime(df.timestamp)


df = df.set_index('timestamp')

df['date'] = df.index.map(lambda t: t.date())
df['time'] = df.index.map(lambda t: t.time())
df_pivot = pd.pivot_table(df, values='value', index='timestamp', columns='time')
df_pivot = df_pivot.fillna(0.0)
print(df_pivot)

生成的輸出

time                 00:00:00  00:15:00  00:30:00  00:45:00  01:00:00  01:15:00  01:30:00  01:45:00
timestamp                                                                                          
2008-03-01 00:00:00      55.0       0.0       0.0       0.0       0.0       0.0       0.0       0.0
2008-03-01 00:15:00       0.0      20.0       0.0       0.0       0.0       0.0       0.0       0.0
2008-03-01 00:30:00       0.0       0.0      13.0       0.0       0.0       0.0       0.0       0.0
2008-03-01 00:45:00       0.0       0.0       0.0      78.0       0.0       0.0       0.0       0.0
2008-03-01 01:00:00       0.0       0.0       0.0       0.0      34.0       0.0       0.0       0.0
2008-03-01 01:15:00       0.0       0.0       0.0       0.0       0.0     123.0       0.0       0.0
2008-03-01 01:30:00       0.0       0.0       0.0       0.0       0.0       0.0      25.0       0.0
2008-03-01 01:45:00       0.0       0.0       0.0       0.0       0.0       0.0       0.0      91.0
2008-03-02 00:00:00      55.0       0.0       0.0       0.0       0.0       0.0       0.0       0.0
2008-03-02 00:15:00       0.0      46.0       0.0       0.0       0.0       0.0       0.0       0.0
2008-03-02 00:30:00       0.0       0.0      66.0       0.0       0.0       0.0       0.0       0.0
2008-03-02 00:45:00       0.0       0.0       0.0      24.0       0.0       0.0       0.0       0.0
2008-03-02 01:00:00       0.0       0.0       0.0       0.0      70.0       0.0       0.0       0.0
2008-03-02 01:15:00       0.0       0.0       0.0       0.0       0.0      32.0       0.0       0.0
2008-03-02 01:30:00       0.0       0.0       0.0       0.0       0.0       0.0      15.0       0.0
2008-03-02 01:45:00       0.0       0.0       0.0       0.0       0.0       0.0       0.0      92.0

我想選擇，例如，只有2008-03-01 00:00:00、2008-03-01 01:15:00和的資料2008-03-02 01:00:00。

預期產出

time                 00:00:00  00:15:00  00:30:00  00:45:00  01:00:00  01:15:00  01:30:00  01:45:00
timestamp                                                                                          
2008-03-01 00:00:00      55.0       0.0       0.0       0.0       0.0       0.0       0.0       0.0
2008-03-01 01:15:00       0.0       0.0       0.0       0.0       0.0     123.0       0.0       0.0
2008-03-02 01:00:00       0.0       0.0       0.0       0.0      70.0       0.0       0.0       0.0

我怎樣才能做到這一點

uj5u.com熱心網友回復：

使用轉換的日期時間串列to_datetime并選擇DataFrame.loc：

#create DatetimeIndex
df = pd.read_csv('df.csv', index_col='timestamp', parse_dates=['timestamp'])
    
#used pandas methods
df['date'] = df.index.date
df['time'] = df.index.time
#added fill_value parameter
df_pivot = pd.pivot_table(df,values='value',index='timestamp',columns='time',fill_value=0)


L = ['2008-03-01 00:00:00','2008-03-01 01:15:00','2008-03-02 01:00:00']
df = df_pivot.loc[pd.to_datetime(L)]
print (df)
time                 00:00:00  00:15:00  00:30:00  00:45:00  01:00:00  \
2008-03-01 00:00:00        55         0         0         0         0   
2008-03-01 01:15:00         0         0         0         0         0   
2008-03-02 01:00:00         0         0         0         0        70   

time                 01:15:00  01:30:00  01:45:00  
2008-03-01 00:00:00         0         0         0  
2008-03-01 01:15:00       123         0         0  
2008-03-02 01:00:00         0         0         0

轉載請註明出處，本文鏈接：https://www.uj5u.com/shujuku/459192.html

標籤：Python 熊猫数据框数据透视表

上一篇：我們可以以更優化的方式撰寫下面的代碼嗎

下一篇：tp如何加快回圈陣列作為pandas計算的輸入？