我有一個df_finalPandas v1.3.4 資料框,正在將它匯出到一個 CSV 檔案,所以我不需要在每次進行分析時重復資料框構建步驟。 df_final將是 13000 x 91 資料幀,但我首先在較小的 689x91 資料幀上測驗該程序。
我想確認df_final_csv通過讀取df_finalCSV生成的df_final資料幀與資料幀相同。根據以下內容,看起來它們是不同的。但是,我不確定如何。我復制了一些堆疊溢位代碼(如下,改編自此處)但其他一些解決方案(例如)不起作用,因為我的df_final. 如何找到導致問題的值?
如果任何其他資訊有幫助,請告訴我。
#689 rows x 91 columns
df_final = pd.DataFrame.from_dict(results)
print (f'NaN are present: {df_final.isnull().values.any()}')# False
#export to csv
df_final.to_csv('integrated_df.csv')
#read in csv
df_final_csv = pd.read_csv('integrated_df.csv', index_col = 0)
print (f' NaN are present: {df_final_csv .isnull().values.any()}')# False')
print (f'imported df is same as exported df: {df_final.equals(df_final_csv)}')#False
#try and find discrepancies (--> empty df)
different_values = df_final_csv [~df_final_csv .isin(df_final)].dropna() #empty df with only column headers
干杯!
uj5u.com熱心網友回復:
也許有一些特殊字符被 CSV 搞亂了。嘗試寫入 .pkl 檔案,您將獲得 100% 相同的資料。
import pickle
# write into pickle file
pickle.dump(df, open("df.pkl", 'wb'))
# then read it
df_new = pickle.load(open("df.pkl", 'rb'))
轉載請註明出處,本文鏈接:https://www.uj5u.com/shujuku/351634.html
上一篇:如何在WindowsPowershell中創建新別名以洗掉多個檔案夾?
下一篇:資料未寫入csv檔案
