我有一個與使用 python 和 Beautifulsoup 從網站上抓取日期相關的問題,就像.split('.', "")那里<p >Oct 24, 2017 ? 4 min read</p>一樣標簽
Published_Date = soup.select_one('p[]').get('datetime')
uj5u.com熱心網友回復:
粗體大點與您在 split() 方法中使用的點
?不同。.因此,用符號替換粗體大點并拆分該符號并使用串列切片獲取第一個值
例子:
from bs4 import BeautifulSoup
html ='''
<p >Oct 24, 2017 ? 4 min read</p>
'''
soup = BeautifulSoup(html,'html.parser')
date = soup.select_one('p.text-xs').get_text(strip=True)
print(date.replace('?','|').split('|')[0])
輸出:
Oct 24, 2017
轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/512091.html
上一篇:熊貓同上年季度差異
