我需要從這個網站上抓取資料: https ://www.daraz.pk/products/hy-i189662857-s1379994759.html?spm=a2a0e.searchlistcategory.list.3.70426378Fs3yJh&search=1
和 html 代碼是:
<div class="mod-reviews">
<div class="item">...</div>
<div class="item">...</div>
<div class="item">...</div>
<div class="item">...</div>
</div>
每個類 div 有 1 條評論,我想提取它。我用硒嘗試了以下代碼:
driver.get(site)
time.sleep(5)
data = driver.find_elements(By.CLASS_NAME,"item")
假設這應該給我所有的專案標簽,但由于某種原因,這不會回傳任何東西。我在這里錯過了什么嗎?
uj5u.com熱心網友回復:
這些元素僅在您向下滾動頁面一段時間后才會出現。嘗試使用像這樣的 javascript 注入來實作 GUI 自動化
for i in range(25):
driver.execute_script("window.scrollBy(0,100)")
可悲的是,除非您將滑鼠游標放在那里,否則滾動不起作用,因此還需要其他 gui 自動化。
可是等等!你可以欺騙它:
for i in range(10):
driver.execute_script("window.scrollBy(0,100)")
for i in range(10):
driver.execute_script("window.scrollBy(0,-100)")
for i in range(25):
driver.execute_script("window.scrollBy(0,100)")
轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/532006.html
