我撰寫了以下源代碼來從亞馬遜書籍中抓取標題/作者。但是,“查找全部”只回傳前 30 本書的資訊,而不是頁面上的所有 50 本書。
我注意到前 30 本書是在沒有滾動搜索欄的情況下已經加載的書,但我不確定這是否是原因。
s = HTMLSession()
url = "https://www.amazon.com/Best-Sellers-Kindle-Store-Arts-Photography/zgbs/digital-text/154607011/ref=zg_bs_nav_digital-text_3_157325011"
r = s.get(url)
soup = BeautifulSoup(r.text, 'html.parser')
books = soup.find_all("div", {"class":"_p13n-zg-list-grid-desktop_truncationStyles_p13n-sc-css-line-clamp-1__1Fn1y"})
uj5u.com熱心網友回復:
嘗試使用該requests庫并將選擇器更改為比class您在代碼中使用的值更不動態的東西。請參閱下面使用請求的示例代碼
from requests import session
from bs4 import BeautifulSoup
s = session()
url = "https://www.amazon.com/Best-Sellers-Kindle-Store-Arts-Photography/zgbs/digital-text/154607011/ref=zg_bs_nav_digital-text_3_157325011"
r = s.get(url)
soup = BeautifulSoup(r.text, 'html.parser')
books = soup.find_all("div", {"id":"gridItemRoot"})
print(len(books))
您將在終端中列印出以下內容
50
轉載請註明出處,本文鏈接:https://www.uj5u.com/shujuku/424248.html
下一篇:當試圖刮入美麗的湯時,刮刀回傳空
