站點地圖(https://futebolnatv.com.br/jogos-hoje/)如下所示:
<div class="col-md-01">
<div class="col-md-12">
<span class="label label-default">0</span>
<img src="https://futebolnatv.com.br/static/times/ba92f23d6f11341548d808a0ec309acc.png" width="25" height="25">
"Holstein Kiel"
</div>
使用CheerioGS, 收集我使用此路徑的文本值:
let elements_2 = $('tbody > tr > td > div:nth-child(2)')
elements_2.each((index, value) => {
sheet.getRange(index 1, 3).setValue($(value).text().trim())
})
但不僅僅是 name Holstein Kiel,它還附帶了這個插入<span>我不想要的數字:
0
Holstein Kiel
預期回報為:
Holstein Kiel
我應該改變什么來解決這個問題?
CheerioGS 專案:
https ://github.com/tani/cheeriogs
uj5u.com熱心網友回復:
您需要將選擇器從
$(value).text().trim()
到
$(value).contents().last().text().trim()
說明:您需要先獲取其所有節點(通過contents()),而不是檢索整個匹配元素的文本,然后獲取您需要的文本節點(通過last())。其余代碼不變。
參考:
- https://cheerio.js.org/classes/Cheerio.html#contents
- https://cheerio.js.org/classes/Cheerio.html#last
uj5u.com熱心網友回復:
你也可以洗掉那些,有時會更快: $('.label').remove()
轉載請註明出處,本文鏈接:https://www.uj5u.com/shujuku/432787.html
標籤:javascript 谷歌应用脚本 网页抓取 切里奥
上一篇:如何僅將日期與日、月和年進行比較
