而不是一天前,幾分鐘前或幾小時前,如果今天發布,我想抓取日期,所以日期應該是今天或使用 python 在 scrapy 中發布日期的日期。
這是我嘗試的代碼。
Published_Date = response.css('time::text').get().replace(",","").replace("Published ","")#Published Jul 30, 2019
if "AGO" in Published_Date:
Published_Date = date.today()
else:
Published_Date = datetime.strptime(Published_Date, "%b %d %Y").date()
網站的網址。https://simpleflying.com/us-carriers-dot-delay-compensation-push/
uj5u.com熱心網友回復:
您可以@datetime直接從<time>標簽中抓取屬性并使用datetime模塊來決議它的發布日期并timedelta檢查它是多久前發布的。
import scrapy
import datetime
class DTSpider(scrapy.Spider):
name = 'dt'
start_urls = ['https://simpleflying.com/us-carriers-dot-delay-compensation-push/']
def parse(self, response):
dt = response.css('span.meta_txt.date').xpath('./time/@datetime').get()
date = datetime.datetime.fromisoformat(dt[:-1])
print(date, '|' ,date.day,'|',date.month, '|', date.year)
# 2022-10-23 17:10:00 | 23 | 10 | 2022 #<-- output
today = datetime.datetime.today()
delta = today - date
print(delta.days) # 0 <-- output
轉載請註明出處,本文鏈接:https://www.uj5u.com/gongcheng/519403.html
上一篇:構建自己的語言工具包——關于編程語言,我們需要關注什么?
下一篇:驗證網站的Bs4決議輸出
