做爬蟲總會遇到各種各樣的反爬限制,反爬的第一道防線往往在登錄就出現了,為了限制爬蟲自動登錄,各家使出了渾身解數,所謂道高一尺魔高一丈,
今天分享個如何簡單處理滑動圖片的驗證碼的案例,

類似這種拖動滑塊移動到圖片中缺口位置與之重合的登錄驗證在很多網站或者APP都比較常見,因為它對真實用戶體驗友好,容易識別,同時也能攔截掉大部分初級爬蟲,
作為一只python爬蟲,如何正確地自動完成這個驗證程序呢?
先來分析下,核心問題其實是要怎么樣找到目標缺口的位置,一旦知道了位置,我們就可以借用selenium等工具完成拖動的操作,
我們可以借用opencv來解決這個問題,主要步驟:

opencv 是什么?
OpenCV(Open Source Computer Vision Library)是開放源代碼計算機視覺庫,主要演算法涉及影像處理、計算機視覺和機器學習相關方法,可用于開發實時的影像處理、計算機視覺以及模式識別程式,
直接安裝

首先將圖片進行高斯模糊處理,高斯模糊的主要作用是減少影像的噪聲,用于預處理階段,

處理后的效果

接著用Canny邊緣檢測到得到一個包含“窄邊界”的二值影像,所謂二值影像就是黑白圖,只有黑色和白色,


輪廓檢測

找出所有的輪廓,并用紅色線框將其繪制標識出來了,看出來大大小小有幾十個輪廓

剩下的問題就好辦了,我們只需要對輪廓的面積或者周長范圍做限制,就能過濾出目標輪廓的位置, 前提是我們對目標位置的輪廓大小是預先確定的,

輪廓的面積大概是6000到8000之間,周長在300到500之間, 最后用外接矩形獲取該輪廓圖的坐標位置和寬高大小,

如上就找到了目標位置,剩下的作業就是將滑塊移動到指定位置即可
需要相關資料的可以加微信領取相關python資料哦 加vx ssmp8858 備注【666】
轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/286307.html
標籤:python
下一篇:神經網路之手寫數字識別
