網站http://100wangke.com/
輸入問題:中東
該怎么爬取?


uj5u.com熱心網友回復:
這個要爬取的資料好像是網頁動態加載的,這樣爬取不到所需要的資訊,查看一下網頁源代碼就知道了。
uj5u.com熱心網友回復:
可以用 selenium 模擬點擊uj5u.com熱心網友回復:
我用selenium模擬輸入問題在點擊搜索,然后怎么獲取呢?uj5u.com熱心網友回復:
那我用selenium模擬搜索后如何獲取呢?uj5u.com熱心網友回復:
你想獲取啥,就爬取相應的部分唄,xpath啥的決議方法,都可以用呀
uj5u.com熱心網友回復:
那我用selenium模擬搜索后如何獲取呢?
這個要爬取的資料好像是網頁動態加載的,這樣爬取不到所需要的資訊,查看一下網頁源代碼就知道了。
不好意思,我對于這個還不會


uj5u.com熱心網友回復:
我用selenium模擬輸入問題在點擊搜索,然后怎么獲取呢?
可以用 selenium 模擬點擊
你想獲取啥,就爬取相應的部分唄,xpath啥的決議方法,都可以用呀
方便具體告訴我用什么代碼嗎?
uj5u.com熱心網友回復:
我用selenium模擬輸入問題在點擊搜索,然后怎么獲取呢?
可以用 selenium 模擬點擊
你想獲取啥,就爬取相應的部分唄,xpath啥的決議方法,都可以用呀方便具體告訴我用什么代碼嗎?
兩個方法:
1.用 selenium:輸入關鍵詞,模擬點擊,然后讓 driver 睡 1秒,檢查答案所在的元素即可
2.抓包,找到它請求的api,我稍微看了一下,他會發送一個ajax請求,里面攜帶了兩個引數 "question" 和 "token",question 是你要輸入查詢的關鍵詞,token 是他構造的一個密文,你可以抓包去 Sources 里面,會找到 token 的生成函式,叫 ccall,用 python 編譯 JavaScript 代碼并執行,生成token即可


授人以魚,不如授人以漁
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/84039.html
