用selenium庫想爬取一個網站,登錄要滑動驗證碼,結果我人工手滑都不行,用selenium開的瀏覽器就是通不過驗證,顯示error。
那個網站的東西是動態加載的,有很多圖片,滾輪劃到了圖片才開始加載,HTML里才能找到圖片資料,劃過了資料也會立馬消失。
本來用selenium庫模擬瀏覽器應該是可以輕松爬取的,速度不是問題,慢點沒事,但是現在問題是selenium庫登錄不上。
現在想到2個辦法,但是我都不會
1:能不能我先開瀏覽器,登錄進去,然后讓Python接管這個瀏覽器
2:我先在一旁登錄,讓selenium庫模擬我登錄上去的情況,跳過登錄這一步
uj5u.com熱心網友回復:
查看chrome.exe的路徑,比如是C:\Users\xxx\AppData\Local\Google\Chrome\Application\chrome.exe
命令列cmd執行
C:\Users\xxx\AppData\Local\Google\Chrome\Application\chrome.exe --remote-debugging-port=9123 --user-data-dir=“d:\selenum_temp_data”
啟動chrome,在chrome中輸入要訪問的網站,操作后需要執行selenium時運行python程式,以獲取標題為例
from selenium import webdriver
from selenium.webdriver.chrome.options import Options
chrome_options = Options()
chrome_options.add_experimental_option("debuggerAddress", "127.0.0.1:9123")
chrome_driver="C:/Users/kamin/AppData/Local/Google/Chrome/Application/chromedriver.exe"
driver = webdriver.Chrome(chrome_driver, chrome_options=chrome_options)
print(driver.title)
uj5u.com熱心網友回復:
什么網站,有很多網站做了selenium反爬,chromedriver會有特征碼轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/87949.html
上一篇:抖音爬蟲介面問題
下一篇:Python turtle繪圖
