我是網路抓取的新手,我正在嘗試使用 Scrapy 抓取以下網站的發布日期:https ://m.imdb.com/title/tt0468569/?ref_=adv_li_tt
這是我正在使用的選擇器:
//a[contains(@class,'ipc-metadata-list-item__list-content-item ipc-metadata-list-item__list-content-item--link')]/text()
它回傳太多元素,我只想要發布資料字串。
uj5u.com熱心網友回復:
要選擇更具體的并僅獲取發布日期的文本,請像這樣調整您的路徑:
//li[contains(@data-testid,'title-details-releasedate')]//li/a/text()
它將選擇<li>包含data-testid具有 value的屬性的title-details-releasedate。因為這些包含兩個<a>它專注于<a>包含在另一個<li>
轉載請註明出處,本文鏈接:https://www.uj5u.com/caozuo/382730.html
