我想抓取多個頁面,但它們只會給出最后一頁的結果,這些是頁面鏈接https://www.baroul-cluj.ro/tabloul-avocatilor/avocati-definitivi/
import pandas as pd
for page in range(1,26):
df=pd.read_html('https://www.baroul-cluj.ro/tabloul-avocatilor/avocati-definitivi/?wpv_view_count=9662&wpv_post_search=&wpv_paged={page}'.format(page=page))
df[0].to_csv('tab.csv',index=False)
uj5u.com熱心網友回復:
那是因為你總是寫入同一個檔案,所以你只會得到最后一個報廢的資料。
解決您的問題的方法是每次都創建一個新檔案,如下所示:
import pandas as pd
for page in range(1,26):
df = pd.read_html('https://www.baroul-cluj.ro/tabloul-avocatilor/avocati-definitivi/?wpv_view_count=9662&wpv_post_search=&wpv_paged={page}'.format(page=page))
df[0].to_csv(f"tab-{page}.csv",index=False)
或者,如果您想要單個檔案,則可以在寫入 CSV 檔案時使用附加模式。
import pandas as pd
for page in range(1,26):
df = pd.read_html('https://www.baroul-cluj.ro/tabloul-avocatilor/avocati-definitivi/?wpv_view_count=9662&wpv_post_search=&wpv_paged={page}'.format(page=page))
df[0].to_csv('tab.csv', mode='a', index=False, header=False)
mode="a":使用附加模式而不是w默認寫入模式。index=False:追加新資料時不要包含索引列。header=False: 追加新資料時不要包含標題。
注意:確保檔案存在才能使用附加模式。
轉載請註明出處,本文鏈接:https://www.uj5u.com/qiye/492885.html
上一篇:如何使用javascript(nodejs)在此html檔案中獲取特定欄位
下一篇:從電話號碼中洗掉點
