請問一下大家,這種頁面的資料怎么采集?
http://gzf.zfcxjw.cq.gov.cn:9090/site/cqgzf/queryresultpublic/applicationresultdetail/30
uj5u.com熱心網友回復:
采集還是爬取?采集需要介面,爬取比較暴力uj5u.com熱心網友回復:
uj5u.com熱心網友回復:
webclient
uj5u.com熱心網友回復:
WebBrowser控制元件實作模擬登陸,獲取登陸資訊 ,組裝引數,請求獲取資料,驗證資料,存入DBuj5u.com熱心網友回復:
這個更難啊,外行不懂uj5u.com熱心網友回復:
正則 或者 看是TABLE 還是DIV, 取 表資料 很容易的。uj5u.com熱心網友回復:
2樓正解....網站自帶json就簡單多了uj5u.com熱心網友回復:
WebBrowseruj5u.com熱心網友回復:
想抓資料 第一步 打開網頁 F12 重繪 看xhr...結果沒想到.. 你這個網站瞬間啥都不用 就能看到一條跟"網頁資料"匹配的介面..
http://gzf.zfcxjw.cq.gov.cn:9090/site/cqgzf/queryresultpublic/getSqshjgAction
看下引數
isInit: true
pageNumber: 1
prefix:
xm:
cnumber:
sqpq:
hx:
code:
tableName: querynow28
分頁 問題也不大.
然后看下資料結構 也很簡單...
dataList: [,…]
messageId: "success"
noData: "N"
pageArray: [1, 2, 3, 4, 5, 6, 7, 8]
pageNumber: 1
totalPage: 1871
所以 用webclient的donwloadstring 提交一下namevalue . 獲取json之后反序列化 就行了..
幾行代碼足以.
uj5u.com熱心網友回復:
這都不用采集了,直接改變頁碼匯入到你自己的應用了uj5u.com熱心網友回復:
先分析字串,然后用正則提取HTML資料轉載請註明出處,本文鏈接:https://www.uj5u.com/net/110448.html
標籤:ASP.NET
上一篇:c# 回圈變數問題
