1、實際需求 EMS郵件的自動分揀,要分揀首先需要獲取郵件的面單號和郵寄地址,現在我們的快遞一般都有紙質面單的,如果是直接使用影像識別技術從紙質面單中獲取資訊,這個開發的成本和實時性都很難保證,獲取資訊之后還要分別處理,出口件要分到全國的對應地區,進口件要分到所在地區的各個小區,所以要提前獲取面單號和郵寄地址兩個關鍵資訊,處理完之后,直接把面單號和地址資訊傳給分揀設備, 2、客觀情況 郵政系統有自己的內網,辦公系統,有查詢的頁面,暫時沒有提供相關的介面開發,看來只能通過爬蟲的相關技識訓取這些關鍵資訊了, 3、CefSharp(WPF) 比較了解C#,這次準備用WPF來開發,之前用CefSharp做過一些混合開發,Html來做頁面,后臺用C#,可以訪問一些本地資源,覺得這種組合比較適合我,看到這個需求,首先就是想到了用CefSharp來訪問他們的內網系統,然后寫JS來自動實作瀏覽頁面,嵌入自定義的 funciton,訪問后臺的C#代碼,保存需要的資訊, 4、具體實作 使用 CefSharp 的Browser.RegisterJsObject 注冊自定義的 funciton ,這個一步是整個爬蟲的重中之重,這樣之后,就相當于可以控制瀏覽器的訪問邏輯了,可以按照我們自己的設計流程來運行,這里面到底是如何運用和能發揮的能量,只取決于你的想象力, 1)注冊自定義 function
3)JS中呼叫自定義funciton
5、總結
整個程序中的關鍵環節是要讓爬取的那個頁面能訪問到后臺C#代碼,CefSharp在爬蟲中就相當于航空母艦級別的存在,是一個重量級的武器,可以不用自己寫正則獲取資料,它已經幫你決議好了,只用寫JS腳本就可以了,
轉載請註明出處,本文鏈接:https://www.uj5u.com/net/22574.html
標籤:WPF
上一篇:wpf/winform獲取windows10系統顏色和主題色
下一篇:Twain_32關閉連接時報錯
