大家好,我正在使用 BS4 從 HTML 網頁中提取表格并嘗試將其添加到 pandas 資料框中,但是當我拉出它時它非常草率,如果有人可以提供幫助,我似乎無法正確列印它?
網頁上只有 1 個表格,這是我正在使用的代碼。以及它在拉什么。
soup = BeautifulSoup(driver.page_source,'html.parser')
df = pd.read_html(str(soup))
print (df)
結果:
[ Unnamed: 0 Student Number Student Name Placement Date
0 NaN 20808456 Sandy Gurlow 01/13/2023
1 NaN NaN NaN NaN]
但我試過用
df.dropna(inplace=True)
我得到錯誤代碼
AttributeError: 'list' object has no attribute 'dropna'
uj5u.com熱心網友回復:
pandas.read_html回傳一個資料框串列,其中包含與在輸入中找到的表一樣多的資料框。
你需要使用:
df = pd.read_html(driver.page_source)[0]
或者,在沒有表的情況下避免 IndexError:
l = pd.read_html(driver.page_source)
if l:
df = l[0]
else:
print('no table found')
轉載請註明出處,本文鏈接:https://www.uj5u.com/qiye/465335.html
