我在 python 中有這個網路爬蟲程式,但它列印了網球運動員 Felix 和 Alexander。我只想將第一個可用的網球運動員作為單獨的專案列印并排除其后的所有網球運動員,那么我需要在代碼中進行哪些更改才能做到這一點?
需要注意的是,我是通過 Visual Studio 2022 完成的,并將該程式應用到使用 Microsoft Edge 網路瀏覽器。
import requests
from bs4 import BeautifulSoup
response = requests.get("https://www.betexplorer.com/tennis/atp-singles/basel/auger-aliassime-felix-bublik-alexander/U5HIueTc/")
webpage = response.content
soup = BeautifulSoup(webpage, "html.parser")
for h2 in soup.find_all('h2'):
values = [data for data in h2.find_all('a')]
for value in values:
print(value.text.replace(" ","_"))
print()
uj5u.com熱心網友回復:
而不是回圈,只是做
print(soup.h2.text.strip())
uj5u.com熱心網友回復:
您可以使用 select() 函式查找該特定標簽并列印第一個,而不是單獨遍歷每個標簽。
import requests
from bs4 import BeautifulSoup
response = requests.get("https://www.betexplorer.com/tennis/atp-singles/basel/auger-aliassime-felix-bublik-alexander/U5HIueTc/")
webpage = response.content
soup = BeautifulSoup(webpage, "html.parser")
print(soup.select('h2 a')[0].text.replace(' ','_'))
轉載請註明出處,本文鏈接:https://www.uj5u.com/ruanti/523631.html
上一篇:在h3標簽中抓取HTML網站
