我開始為我的俱樂部撰寫抓取腳本。我希望創建一個腳本,可以收集俱樂部球隊的所有資料,并使我的資料分析更容易。我正在處理下面的代碼,但是我正在努力從“actaEquipos”中獲取文本。我的代碼應該收集主隊和客隊,我稍后會將其添加到 Excel 表中,但我卡在第一步。
from bs4 import BeautifulSoup
from bs4.element import Stylesheet
import requests, openpyxl
excel = openpyxl.Workbook()
print(excel.sheetnames)
sheet = excel.active
sheet.title = "Acta Partido"
print (excel.sheetnames)
try:
source = requests.get('https://www.fcf.cat/acta/2022/futbol-11/cadet-primera-divisio/grup-2/1c/sant-ignasi-ce-a/1c/lhospitalet-centre-esports-b')
source.raise_for_status()
soup = BeautifulSoup(source.text,'html.parser')
actaEquipos = soup.find_all('div', class_='acta-equip')
actaMarcador = soup.find('div', class_='acta-marcador').text
acta = soup.find_all('table', class_='acta-table')
print(actaEquipos)
for equipo in actaEquipos:
nombreEquipo = equipo.find('span', class_='tr').txt
print(nombreEquipo)
print(len(actaEquipos))
break
except Exception as e:
print(e)
excel.save('ActaPartido.xlsx')
誰能幫我理解我錯過了什么?
謝謝
uj5u.com熱心網友回復:
怎么了?
您的代碼中只有一個拼寫錯誤應該得到文本 - 沒有顯示錯誤,選擇的原因是 None
怎么修?
通過在 txt 中添加一個 e 來修正拼寫錯誤:
nombreEquipo = equipo.find('span', class_='tr').text
轉載請註明出處,本文鏈接:https://www.uj5u.com/caozuo/382729.html
上一篇:使用Selenium捕獲在Python中延遲加載的元素
下一篇:特定元素的網頁抓取選擇器
