但我面臨從 bs4 標簽中提取資料的問題,我無法僅提取產品名稱和成本
產品名稱也是如此,無法提取產品名稱
我嘗試使用索引但失敗了,因為它是我也使用過的標簽.getText(),.get_text()并嘗試轉換為 str 并附加到list該標簽中也失敗并且無法獲得所需的確切資訊。
我無法在第一張圖片中提取準確的 159995(沒有盧比符號和逗號),在第二張圖片中提取產品名稱
uj5u.com熱心網友回復:
根據您的示例,它應該如下,因為您的 中只有一個標簽ResultSet:
soup.select_one('.BNuCI').get_text(strip=True)
否則你必須迭代你的ResultSet:
for e in soup.select('.BNuCI'):
print(e.get_text(strip=True))
根據您的評論:
成本的方式相同,您可以regex僅使用例如數字來提取:
import re
cost = ''.join(re.findall(r'\d ', soup.select_one('.YOURCLASSVALUES').get_text(strip=True)))
轉載請註明出處,本文鏈接:https://www.uj5u.com/gongcheng/530368.html
下一篇:如何使用R語言抓取多頁網站
