學習爬蟲一段時間了,在使用scrapy時,想要按順序把 item 儲存至資料庫sqlite,
思路1:
在pipeline 中使用append集合item,到達指定資料量后,排序存盤
思路2:
在yield item前做排序,但好像又失去異步框架的優勢
請問為大佬,有什么方法如何實作?最好能有個指導性的代碼,謝謝!
uj5u.com熱心網友回復:
自己好好研究了思路1的,解決了。def process_item(self, item, spider):
xxxxxxxxxxxxxxxxxxxxxxxxxxxx
self.item_list.append(item) # 進行item集合
def close_spider(self, spider):
list_sorted = sorted(self.item_list, key=lambda x: x['linkid']) # 使用item['linkid']進行排序
for item in list_sorted:
#此處item已按item['linkid']照進行排序
參考了:https://blog.csdn.net/baifanwudi/article/details/87779824
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/147567.html
上一篇:匯編陳述句
