我試圖廢棄所有 8 頁的表格,但我的代碼只是廢棄了第一個表格。它可以移動到其他頁面,也可以在每個頁面上單獨作業,但不能洗掉所有頁面。
data_ingram = []
n = 1
for i in range(1,pagenum 1):
driver.get(f"https://www.ingrammicro.com/IMD_WASWeb/jsp/search/Results.jsp?cache=900&key=;moc.orcimmargni.etaroproc.D7801LQSWHCSU:ns;48334463074612032GVDM:saila&type=1&perf=0&user=VG2302&kwds=&siskwds=&PerP=25&cate=&sCat=&mVnd=&tab=vendTab&pBgn=&pEnd=&iStk=&prom=&intl=2&acad=2&pc=&mac=&unix=2&auth=&spec=&cnsr=&dcon=&nDys=&dDys=&fCls=&fVal=&level=&page={n}&sCls=OrderNbr|ProductDes&sVal=++")
html = driver.page_source
tables = pd.read_html(html)
data = tables[11]
data_ingram.append(data)
n = 1
df_ingram = pd.DataFrame(data_ingram[0])
df_ingram.drop_duplicates()
df_ingram
uj5u.com熱心網友回復:
而不是這一行:
df_ingram = pd.DataFrame(data_ingram[0])
用這個:
df_ingram = pd.concat([pd.DataFrame(x) for x in data_ingram])
轉載請註明出處,本文鏈接:https://www.uj5u.com/gongcheng/441196.html
標籤:python-3.x 熊猫 硒 网页抓取 美丽的汤
下一篇:在Windows中運行pre-commitpython包會給出ExecutableNotFoundError:Executable`/bin/sh`
