一、前言
上篇文章我們學習了Selenium頁面操作原理及如何高效的進行元素定位
那Selenium的作業原理又是什么?是如何驅動瀏覽器的呢?這篇文章為你講解Selenium作業原理及Webdriver對瀏覽器的配置和操作,
(PS:個人在用的人工智能學習網站推薦給大家:captainai,覺得不錯請三連支持一下)
文章目錄
- 一、前言
- 二、Selenium作業原理
- 三、Webdriver常用配置
- 1. 啟動瀏覽器
- 2. Webdriver配置項
- 2.1 首先呼叫對應的配置類(以chrome舉例)
- 2.2 最大化瀏覽器視窗
- 2.3 隱藏瀏覽器運行(無界面Linux時,不加這潭訓報錯)
- 2.4 給予root執行權限(Linux上運行時需要)
- 2.5 不加載圖片,提升速度
- 2.6 使用已打開的瀏覽器
- 2.7 手動指定瀏覽器位置
- 2.8 隱藏【受到自動化測驗軟體的控制】提示
- 2.9 指定瀏覽器大小
- 2.10 指定瀏覽器位置
- 2.11 指定瀏覽器啟動語言
- 2.12 更換瀏覽器請求頭
- 2.13 設定瀏覽器代理
- 2.14 使用配置
- 3. Webdriver常用操作
- 3.1 獲取瀏覽器名稱
- 3.2 最大化瀏覽器視窗
- 3.3 最小化瀏覽器視窗(Selenium4支持)
- 3.4 全屏視窗
- 3.5 訪問指定網址
- 3.6 獲取當前頁url
- 3.7 獲取當前頁的title
- 3.8 獲取當前頁視窗句柄
- 3.9 截屏當前視窗
- 3.10 重繪
- 3.11 前進(瀏覽器的【前進】按鈕)
- 3.12 后退(瀏覽器的【后退】按鈕)
- 3.13 設定瀏覽器大小
- 3.14 設定瀏覽器位置
- 3.15 獲取瀏覽器大小
- 3.16 獲取瀏覽器位置
- 3.17 執行js腳本
- 3.18 切換視窗
- 3.19 切換iframe
- 3.20 離開iframe
- 2.21 關閉當前視窗
- 3.22 退出瀏覽器
- 四、總結
二、Selenium作業原理
Selenium進行自動化測驗主要依賴三項:
- 測驗腳本(你寫的代碼)
- 瀏覽器驅動(Webdriver,比如:chromedriver)
- 瀏覽器
其中核心部分就是Webdriver,它提供了一系列的API來供我們使用,以至于驅動瀏覽器做一些操作,
它的作業原理有時也會作為面試題,不少小伙伴Selenium用的很熟練,但因為答不出它的作業原理而被Pass!
所以我簡單總結了一下,為了面試不被pass的標準答案
Webdriver作業原理:
webdriver用于通信用戶撰寫的代碼和瀏覽器,
當使用類似webdriver.Chrome()啟動瀏覽器后,webdriver會將啟動的瀏覽器系結到特定的埠,并作為服務端 (類似前后端分離專案的后端)
客戶端 (用戶撰寫的代碼),通過ComandExecutor發送HTTP請求給服務端
服務端通過WebService將其翻譯為瀏覽器讀的懂的腳本傳給瀏覽器進行執行,執行完成后,瀏覽器把執行結果回傳給WebService,WebService再把回傳的結果做一些封裝,然后回傳給客戶端,

三、Webdriver常用配置
1. 啟動瀏覽器
通過查看Selnium->webdriver檔案夾,發現Selnium支持6種瀏覽器:
chrome、edge、firefox、ie、opera、safari

這里用谷歌、火狐的啟動來舉例
- 啟動谷歌瀏覽器(需要chromedriver)
from selenium import webdriver
browser = webdriver.Chrome()
- 啟動火狐瀏覽器(需要geckodriver)
from selenium import webdriver
browser = webdriver.Firefox()
2. Webdriver配置項
webdriver有很多配置項,例如設定請求頭、隱藏瀏覽器運行、配置Webdriver路徑等;下面為你介紹常用的配置項:
2.1 首先呼叫對應的配置類(以chrome舉例)
chrome_options = webdriver.ChromeOptions()
2.2 最大化瀏覽器視窗
chrome_options.add_argument('--start-maximized')
2.3 隱藏瀏覽器運行(無界面Linux時,不加這潭訓報錯)
chrome_options.add_argument('--headless')
2.4 給予root執行權限(Linux上運行時需要)
chrome_options.add_argument('--no-sandbox')
2.5 不加載圖片,提升速度
chrome_options.add_argument('blink-settings=imagesEnabled=false')
2.6 使用已打開的瀏覽器
以chrome瀏覽器舉例,我們可以通過【cmd】在chrome所在目錄執行命令:
chrome.exe --remote-debugging-port=9222 --user-data-dir="C:\selenum\AutomationProfile"
-remote-debugging-port:用于配置瀏覽器啟動占用的埠,可以指定任何未被占用的埠
-user-data-dir:指定創建新Chrome組態檔的目錄;它是為了確保在單獨的組態檔中啟動chrome,不會污染你的默認組態檔,
然后在代碼中加入下面的配置即可使用剛剛打開的瀏覽器了
chrome_options.add_experimental_option("debuggerAddress", "127.0.0.1:9222")
這樣做的好處是:
- 是一個由chrome啟動的瀏覽器,不容易被所測網站檢測出是自動化程式、有利于爬蟲的過檢測,
- 基于該運行瀏覽器所產生的快取、cookie等資料都會被記錄,下次啟動的時候不用重新登錄帳號,也不用因為沒有快取導致頁面加載時間過長,
2.7 手動指定瀏覽器位置
當存在多個谷歌瀏覽器或谷歌瀏覽器環境例外時,可以指定其瀏覽器檔案路徑進行驅動
chrome_options.binary_location = r"C:\Program Files (x86)\Google\Chrome\Application\chrome.exe"
2.8 隱藏【受到自動化測驗軟體的控制】提示

通過該配置項可以隱藏上圖的提示
chrome_options.add_experimental_option('excludeSwitches', ['enable-automation'])
2.9 指定瀏覽器大小
下面的代碼會啟動一個寬100,長1000的瀏覽器
chrome_options.add_argument(f'--window-size={100},{1000}')
2.10 指定瀏覽器位置
下面的代碼會啟動一個左邊距為100,上邊距為200的瀏覽器
chrome_options.add_argument(f'--window-position={100},{200}')
2.11 指定瀏覽器啟動語言
有時候開啟瀏覽器需要特別的語言版本,如果未進行配置則啟動的是系統語言對應的瀏覽器,我們的被測網站如果是英文的,但系統是中文的,開啟的瀏覽器就是中文的,提交的某些資料按照zh_CN.UTF-8的格式提交了,導致資料報錯,那么我們就需要設定瀏覽器啟動語言,
chrome_options.add_argument('lang=en-us')
2.12 更換瀏覽器請求頭
有時候需要模擬手機訪問某些頁面的時候,可以通過配置user-agent項來實作
下面的代碼會將瀏覽器模擬為安卓手機訪問
user_ag = 'MQQBrowser/26 Mozilla/5.0 (Linux; U; Android 7.3.7; zh-cn; MB200 Build/GRJ22;CyanogenMod-7) ' \
'AppleWebKit/533.1 (KHTML, like Gecko) Version/4.0 Mobile Safari/533.1 '
chrome_options.add_argument('user-agent=%s' % user_agent)
執行效果

2.13 設定瀏覽器代理
chrome_options.add_argument('--proxy-server=你的代理ip地址')
2.14 使用配置
下面的代碼會【最大化視窗】且【不加載圖片】的啟動一個瀏覽器:
from selenium import webdriver
chrome_options = webdriver.ChromeOptions()
chrome_options.add_argument('--start-maximized')
chrome_options.add_argument('blink-settings=imagesEnabled=false')
browser = webdriver.Chrome(options=chrome_options)
3. Webdriver常用操作
3.1 獲取瀏覽器名稱
browser.name
3.2 最大化瀏覽器視窗
browser.maximize_window()
3.3 最小化瀏覽器視窗(Selenium4支持)
browser.minimize_window()
3.4 全屏視窗
類似瀏覽器中按下【F11】
browser.fullscreen_window()
3.5 訪問指定網址
browser.get("https://www.baidu.com") #訪問百度
3.6 獲取當前頁url
browser.current_url
3.7 獲取當前頁的title
browser.title
3.8 獲取當前頁視窗句柄
browser.current_window_handle
3.9 截屏當前視窗
browser.save_screenshot('test.png') #截取當前視窗并命名為`test.png`保存
3.10 重繪
browser.refresh()
3.11 前進(瀏覽器的【前進】按鈕)
browser.forward()
3.12 后退(瀏覽器的【后退】按鈕)
browser.back()
3.13 設定瀏覽器大小
設定瀏覽器寬為480,高為800
browser.set_window_size(480, 800)
3.14 設定瀏覽器位置
設定瀏覽器寬為480,高為800
browser.set_window_position(480, 800)
3.15 獲取瀏覽器大小
設定瀏覽器寬為480,高為800
browser.get_window_size(480, 800)
3.16 獲取瀏覽器位置
設定瀏覽器寬為480,高為800
browser.get_window_position(480, 800)
3.17 執行js腳本
如果需要進行頁面滑動(模擬滑鼠滾輪操作)可以通過執行js腳本實作
例如滑動到'//*[@id="asideHotArticle"]/h3'元素:
target = browser.find_element(By.XPATH, '//*[@id="asideHotArticle"]/h3')
browser.execute_script("arguments[0].scrollIntoView();", target)
3.18 切換視窗
有多個視窗時,可以通過下面的方法進行切換才能夠順利的進行定位
browser.switch_to.window(browser.window_handles[1])
3.19 切換iframe
頁面中的iframe彈窗,需要使用下面的代碼切換才能夠順利的進行定位
iframe = browser.find_element(By.CSS_SELECTOR, "#modal > iframe")
# 切換到iframe
browser.switch_to.frame(iframe)
3.20 離開iframe
離開iframe,回到默認頁面
browser.switch_to.default_content()
2.21 關閉當前視窗
有多個頁面的時候,只會關閉當前所在頁面
browser.close()
3.22 退出瀏覽器
會直接關閉瀏覽器,所有頁面都將關閉
browser.quit()
四、總結
實際上webdriver的操作還有很多,比如遠程控制項的配置,cookie相關配置等,但都不常用,掌握這些些已經足夠了!
下一篇文章會對selenium的鍵盤滑鼠事件進行詳解,歡迎訂閱本專欄!
轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/309522.html
標籤:python
