我正在閱讀:BeautifulSoup 是否有可能以不區分大小寫的方式作業?
但這不是我真正需要的,我正在尋找img網頁中的所有標簽,其中包括:IMG, Img etc...
這段代碼:
images = soup.findAll('img')
只會尋找img區分大小寫的標簽,那么如何在不為每種可能性添加新行的情況下解決這個問題(并且可能忘記添加一些)?
請注意,上述問題與標簽無關,而是與屬性有關。
uj5u.com熱心網友回復:
BeautifulSoup 本身不區分大小寫,請嘗試一下。如果您在結果中遺漏了一些資訊,則可能還有另一個問題。xml如果在某些情況下需要,您可以在使用決議器時強制它決議敏感。
注意: 在較新的代碼中,請避免使用舊語法findAll(),而是使用find_all()- 更多請花一分鐘時間查看檔案
例子
from bs4 import BeautifulSoup
html = '''
<img src="" alt="beautifulsoup 不區分大小寫?">
<IMG src="" alt="beautifulsoup 不區分大小寫?">
<iMG src="" alt="beautifulsoup 不區分大小寫?">
'''
soup = BeautifulSoup(html)
soup.find_all('img')
輸出
[<img alt="lower" src=""/>,
<img alt="upper" src=""/>,
<img alt="mixed" src=""/>]
轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/485521.html
標籤:Python python-3.x 网页抓取 美丽的汤
上一篇:無法匯入世界人口資料('https://countrymeters.info/en')
下一篇:添加可變數量的變數
