https://rate.tmall.com/list_detail_rate.htm?itemId=588049695865&spuId=1158864898&sellerId=2760516294&order=3¤tPage=4&append=0&content=1&tagId=&posi=&picture=1
uj5u.com熱心網友回復:
在python剛開始在天朝有流行趨勢的時候,曾經有人告訴我python多偉大,3行代碼做采集我說貼出來看看,他就是3句話,啟動瀏覽器控制元件,訪問地址,然后得到結果
你知道我們怎么回復么?我們說,如果這就是偉大,那么vbscript一樣偉大,他一樣3行代碼,依舊是啟動瀏覽器組件,訪問地址,然后得到結果。
同樣C#一樣,一個httpclient,一個訪問url,一個獲取結果,一樣3行。
代碼不貼,你知道“C# httpclient”足夠你百度出結果了
uj5u.com熱心網友回復:
搞了半天是應為這個需要用HTTP2.0協議,默認的httpclient好像不行。
uj5u.com熱心網友回復:
沒有登錄cookie的時候
帶上cookie的enc值后

uj5u.com熱心網友回復:
這個需要用HTTP2.0協議,問題就是這里。
uj5u.com熱心網友回復:
好吧,我承認我水平有限!從上午干到現在終于搞定了。問題不在于HTTP2.0協議。確實PHYTHON能做到的C#也能做到。
不僅僅是httpcilent。。httpwebrequest,都可以,感謝這位大俠。
uj5u.com熱心網友回復:
應該是需要開通SSLuj5u.com熱心網友回復:
我給你舉一個我們對采集的例子。例如采集這個頁面http://quote.eastmoney.com/center/gridlist.html#hs_a_board這個頁面上有一個Table,是異步動態加載的資料,而且還要翻頁。當我們給一個程式員布置一個采集任務的時候,就是要求他使用 grckofx 來加載頁面并采集這個動態填充資料的 Table 前10頁的表格中的 tr 里的單元格內資料,并且在一個介面方法async Task<List<采集結果>> 采集(){
....
}這樣的方法中直接回傳,也就是說要讓呼叫的其它程式員用一個類似于同步訪問的代碼來獲得這個采集結果,而不是搞什么復雜的“事件編程”模型。你能理解這個需求嗎?這需要一個人大半天的作業量。
uj5u.com熱心網友回復:
現在許多東西都需要異步加載,甚至還需要模擬用戶在頁面上的復雜操作,才能采集到結果。這才是采集程式。不是什么簡單地 downloadstring 就能搞定的,要專業1千倍,而且還得快。uj5u.com熱心網友回復:
我的理解,python采集方便,應該是py的庫豐富。不然光靠語言能有什么差別。uj5u.com熱心網友回復:
既然你這么說,就把python的程式打包,用C#呼叫就是了。轉載請註明出處,本文鏈接:https://www.uj5u.com/net/29705.html
標籤:C#
上一篇:C#地鐵一卡通專案代碼
下一篇:求幫忙
