這樣我就有了一個等待頁面上元素的作業代碼:
wait = WebDriverWait(driver, 60)
try:
imo_giris = wait.until(EC.visibility_of_element_located((By.XPATH, "//*[@id='P_ENTREE_HOME']")))
imo_giris.send_keys(imo, "\n")
except TimeoutException:
print("None")
driver.close()
continue
如何將此 WebDriverWait() 模塊集成到我的代碼中,以便在我的頁面的源代碼中找到電子郵件正則運算式?這是我獲取網站電子郵件正則運算式的代碼:
results = []
for query in my_list:
results.append(search(query, tld="com", num=3, stop=3, pause=2))
for result in results:
url = list(result)
print(*url,sep='\n')
for site in url:
driver = webdriver.Chrome()
driver.get(site)
doc = driver.page_source
emails = re.findall(r'[\w\.-] @[\w\.-] ', doc)
for email in emails:
print(email)
我可以從頁面上的源代碼中找到電子郵件,但有時由于源代碼太長,網站不活躍或需要很多時間。我想將電子郵件正則運算式搜索減少到 10 秒,我該怎么做?
我解決了這個問題
我用更好的正則運算式替換了它。我現在使用的正則運算式作業正常:
r'\b[A-Za-z0-9._% -] @(?:[A-Za-z0-9-] \.) [A-Za-z]{2,4}\b'
uj5u.com熱心網友回復:
您可以創建自定義的預期條件,但這似乎有點矯枉過正。相反,您可以使用for帶有時間測量的簡單回圈
...
doc = driver.page_source
emails = []
end_time = time.time() 10
while time.time() < end_time and not emails:
emails = re.findall(r'[\w\.-] @[\w\.-] ', doc)
print(emails)
轉載請註明出處,本文鏈接:https://www.uj5u.com/ruanti/391985.html
標籤:Python 蟒蛇-3.x 正则表达式 硒 网络驱动程序等待
