已確定當前url樣式為:"https://list.jd.com/....."
在settings中ua、headers、機器人協議遵守已為False,各并發及下載延遲已適應降低情況下,
設定allow_domain = ['jd.com']/['list.jd.com']/[],且yield scrapy.Request(url,dont_filter=True,callback=self.xxx),
運行后xxx函式仍無資料。
嘗試import requests并進行request.get(url, headers=....,...)成功獲取資料。
當下很疑惑,代碼問題在哪兒。
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/128845.html
