各位老師好,
我從事跨境電商,經常需要獲取競爭對手的銷售頁面資料,我知道 python 可以做到這項作業,具體步驟為:
1,通過競爭對手商品的商品代碼(ASIN) - 這是我們提前就給到的,則可以獲得競爭對手的銷售頁面鏈接,格式為:"https://www.amazon.com/dp/"+ASIN
在我們的原始表格里有一列這樣的 ASIN 資料
2,進入競爭對手的銷售頁面后,我想獲取他們的以下資料:品牌 - 標題 - 售價 - 評論 - 星級 - 問答 - 類目 - BSR1 - 節點 - BSR2(按F12可以得到這些元素的對應代碼)
3,將獲得的所有資料匯入到一張excel作業表中
4,需要遍歷所有競爭對手的 ASIN
需要注意的是,亞馬遜網站有很強的反爬機制,如何做好反反爬?(我看到有些類似的 python 程式通過延時來做到)
非常感謝老師愿意提供寶貴幫助
如果可以,后面還有很多這樣的作業需要幫助
uj5u.com熱心網友回復:
簡單一點的 User-Agent +Referer檢測難一點的要換IP,解密,識別驗證碼
uj5u.com熱心網友回復:
謝謝回復uj5u.com熱心網友回復:
使用selenium 的瀏覽器,多執行緒并發訪問多個頁面,然后分析頁面資料,存盤資料庫,都結束后,從資料庫匯總資料,輸出到頁面/exceluj5u.com熱心網友回復:
怎么又是你,還沒解決嗎uj5u.com熱心網友回復:
謝謝老師指導uj5u.com熱心網友回復:
還沒有,謝謝老師uj5u.com熱心網友回復:
https://blog.csdn.net/cq31379/article/details/100198117轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/112309.html
下一篇:kitti轉成voc格式時,老是報錯AttributeError: 'NoneType' object has no attribute 'shape'
