所以我想決議一頁,它有幾個具有以下結構的專案:
<span itemprop="telephone" [class]="revealtel?'':'invisible'" class="">11111111</span>
<span itemprop="telephone" [class]="revealmainfax?'':'invisible'" class="">222222222</span>
我正在使用 Scrapy 和 CSS 選擇器來決議資料。但我不明白如何獲得電話或傳真號碼。itemprop在兩種情況下都是一樣的,所以不能使用。那么,如何選擇具有[class]="revealtel?'':'invisible'
或[class]="revealmainfax?'':'invisible'
屬性的元素呢?也許不使用 CSS 選擇器,而是使用 Xpath?雖然我對 Xpaths 并不強...
提前感謝您幫助我:)
uj5u.com熱心網友回復:
使用 xpath 從帶有telephone
as itemprop 的元素中獲取所有文本的串列。
faxnum = None
telnum = None
numbers = response.xpath('//span[@itemprop="telephone"]')
for element in numbers:
text = element.extract()
if re.search('revealmainfax', text):
faxnum = element.xpath('./text()')
else:
telnum = element.xpath('./text()')
uj5u.com熱心網友回復:
嘗試:
response.css('span[itemprop="telephone"]::text').getall()
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/496798.html
上一篇:bs4腳本不回傳錯誤但不執行代碼