我不知道下面評論的行應該做什么,有人可以幫助我。
df_scraped = pd.read_csv("labeled_tweets.csv")
df_public = pd.read_csv("public_data_labeled.csv")
# df_scraped.drop_duplicates(inplace = True)
# df_scraped.drop('id', axis = 'columns', inplace = True)
# df_public.drop_duplicates(inplace = True)
鏈接到原始代碼
uj5u.com熱心網友回復:
這些行是資料預處理行(或資料清洗)。
- 第一行從 df_scraped 資料框中洗掉重復的行。
- 第二行洗掉了“id”列。
- 第三行從 df_public 資料幀復制行。
uj5u.com熱心網友回復:
df.drop_duplicates(inplace=True)將執行從資料框中洗掉重復行。該inplace = True引數導致在資料幀中執行更改并且不帶副本。
.drop('id', axis = 'columns', inplace = True)洗掉“id”列。
熊貓檔案:
.drop_duplicates
.drop
轉載請註明出處,本文鏈接:https://www.uj5u.com/qukuanlian/441881.html
