我有這樣的構造
<p>File name</p>
<a href="https://somelink.pdf">Download</a>
我需要使用 CSS 和 XPath捕獲鏈接a及其名稱。p我正在嘗試執行以下操作,首先我使用 CSS 選擇器找到所有href值以.pdf( a[href$=".pdf"]) 結尾的檔案:
for i in response.css('a[href$=".pdf"]'):
link = i.css('::attr("href")').get()
name = i.xpath(?????????)
print(name, link)
如何p使用 XPath 捕獲元素中的文本?
uj5u.com熱心網友回復:
從...開始 a
這個 XPath,
//a[.="Download"]/preceding-sibling::p[1]
將選擇字串值等于的p每個元素之前的第一個元素兄弟。a"Download"
從...開始 p
這個 XPath,
//p[.="File name"]/following-sibling::a[1]
將選擇字串值等于的a每個元素之后的第一個元素兄弟。p"File name"
無論哪種情況,您都可以通過附加/text()到 XPath 來選擇文本節點子節點。
轉載請註明出處,本文鏈接:https://www.uj5u.com/caozuo/421568.html
標籤:
上一篇:Selenium(python):檢索錨的href和文本
下一篇:從網站抓取資料
