我正在處理一個資料框,我可以通過在 jupyter notebook 的單獨單元格中運行以下代碼來清理該資料框。但是,我需要在組織完全相同的幾個資料幀上運行這些相同的任務。我如何撰寫一個可以執行下面任務 2 到 4 的函式?
作為參考,我正在使用的日期位于此處。
[1]: df1 = pd.read_csv('202110-divvy-tripdata.csv')
[2]: df1.drop(columns=['start_station_name','start_station_id','end_station_name','end_station_id','start_lat','start_lng','end_lat','end_lng'],inplace=True)
[3]: df1['ride_length'] = pd.to_datetime(df1.ended_at) - pd.to_datetime(df1.started_at)
[4]: df1['day_of_week'] = pd.to_datetime(df1.started_at).dt.day_name()
uj5u.com熱心網友回復:
您可以在 中的單元格中定義一個函式Jupyter,運行此單元格然后呼叫該函式:
def process_df(df):
df1['ride_length'] = pd.to_datetime(df1.ended_at) - pd.to_datetime(df1.started_at)
df1['day_of_week'] = pd.to_datetime(df1.started_at).dt.day_name()
使用 each 呼叫函式DataFrame:
df1 = pd.read_csv('data1.csv')
df2 = pd.read_csv('data2.csv')
process_df(df1)
process_df(df2)
根據這個答案,兩個DataFrames 都將被更改,并且不需要從函式回傳一個新物件。
轉載請註明出處,本文鏈接:https://www.uj5u.com/caozuo/520305.html
標籤:Python数据框功能
