我正在使用美麗的湯來嘗試使用美麗的湯從守望先鋒聯賽日程網站獲取資料,盡管所有檔案都說 bs4 能夠找到嵌套的 div,如果我有他們的類,它只回傳一個空串列。
這是網址:https : //overwatchleague.com/en-us/schedule? stage = regular_season & week =1
這是我想要得到的:
bs = BeautifulSoup(req.text, "html.parser")
matches = bs.find_all("div", class_="schedule-boardstyles__ContainerCards-j4x5cc-8 jcvNlt")
最終能夠遍歷其中的 div 并從中抓取匹配資料。但是,它不起作用,只回傳一個[],我做錯了什么嗎?
uj5u.com熱心網友回復:
當一個頁面被加載時,它通常會運行一些腳本來填充資訊。
Beautifulsoup 只是一個決議器,不能渲染頁面。
在使用 beautifulsoup 查找元素之前,您需要像selenium 之類的東西來渲染頁面
uj5u.com熱心網友回復:
它不起作用,因為request在頁面完全加載之前獲取 html。我認為沒有辦法讓它等待。你可以嘗試用硒來做
轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/317053.html
上一篇:需要網頁抓取授權
