我知道這個問題可能看起來很基本,但我似乎無法從給定的 uls 中提取 li 和文本。
https://solar.world.org/reuse/Aluminum.Foil
這是我要提取的網址。我曾嘗試將 find_all 用于 ul,但這給了我一個奇怪的回傳結果,我無法使用它從 li 中提取任何文本。
理論上,這段代碼應該可以作業。
page = requests.get('https://solar.world.org/reuse/Aluminum.Foil')
soup = BSoup(page.content, 'html.parser')
for i in soup.find_all('ul'):
for j in i.find_all('li'):
print(j.text)
但它不是。
uj5u.com熱心網友回復:
該頁面的格式非常糟糕(不是您的錯)。使用更好的決議器來決議它:
soup = BSoup(page.content, 'html5')
轉載請註明出處,本文鏈接:https://www.uj5u.com/ruanti/490640.html
下一篇:過濾器不更改URL時抓取網頁
