xpath_id = '/html/body'
conf_code = driver.find_element(By.XPATH, (xpath_id))
code_list = []
for c in range(len(conf_code)):
code_list.append(conf_code[c].text)
如上所示,我選擇了 xpath 定位器,但我找不到文本,這是因為這個特定的網頁是完全空白的,因為僅作為“正文”中的文本,頁面的 html 如下所示:
?html? , ?head?, ?body? '我想閱讀和保存的文本' ?body?, ?/html?
如何閱讀此文本,然后將其存盤在變數中
uj5u.com熱心網友回復:
你的問題不夠清楚。
無論如何,如果該頁面上有多個包含文本的元素,您可以使用以下內容:
xpath_id = '/html/body/*'
conf_code = driver.find_elements(By.XPATH, (xpath_id))
code_list = []
for c in conf_code:
code_list.append(c.text)
在從那里獲取所有這些元素之前,不要忘記添加一些延遲以使頁面完全加載
uj5u.com熱心網友回復:
如果您真的只是抓取一個如此簡單的網站,則不需要 selenium。抓取帶有請求的網站并在正文標簽上拆分結果以獲取文本。更簡單的代碼并避免了 selenium 驅動程式的開銷。
import requests
url = "http://your-url-here.com"
content = requests.get(url).text
the_string_youre_looking_for = content.split('<body>')[1].split('</body>')[0]
這是你要找的嗎?如果不是,也許嘗試改寫您的問題,因為很難理解您希望代碼做什么以及在什么背景關系中。
uj5u.com熱心網友回復:
解決使用
print(driver.page_source)
我得到了完整的 HTML 內容,由于它的簡單性,很容易使用<body>TAG提取到所需的內容
轉載請註明出處,本文鏈接:https://www.uj5u.com/gongcheng/406767.html
標籤:
