我正在嘗試抓取 Twitter 帖子中的鏈接,但我想要的鏈接位于不同的 div 標簽下。有多個父 div 標簽,我只對特定父 div 標簽下的鏈接感興趣。我檢查的 HTML 向我展示了這樣的內容:
我看到的 HTML 檢查示例
我在這里搜索了一些關于通過 xpath 為硒有條件地查找元素的答案。我用來獲取我想要的鏈接的python代碼是:
[links.add(elem.get_attribute('href'))
for elem in browser.find_elements_by_xpath("//a[@dir ='ltr'] and //*[contains(@class, 'ABC')]")]
這是我得到的輸出“結果不是節點集,因此無法轉換為所需的型別。”:
selenium.common.exceptions.InvalidSelectorException:訊息:無效選擇器:無法使用 xpath 運算式定位元素 //a[@dir ='ltr'] 和 //*[contains(@class, 'r-1blvdjr')]因為以下錯誤:TypeError:無法對“檔案”執行“評估”:結果不是節點集,因此無法轉換為所需的型別。(會話資訊:chrome=97.0.4692.71)
您能否指導我如何糾正這個問題以獲得我想要的輸出,這些輸出是特定父 div 標簽下的鏈接。這是我第一次在 stackoverflow 上發布問題,很抱歉,如果這個問題無論如何都沒有讓人們了解我目前面臨的錯誤。
uj5u.com熱心網友回復:
[links.add(elem.get_attribute('href'))
for elem in browser.find_elements_by_xpath("//*[contains(@class, 'ABC')]/descendant::a[@dir ='ltr']")]
轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/412062.html
標籤:
上一篇:<span>內沒有類的BS4文本
下一篇:使用Python抓取房地產網站
