我正在嘗試學習 python selenium,我已經被困了好幾天,試圖找出讓我從這小塊代碼中只提取日期的最佳方法。我最好的猜測是
driver.find_element(By.XPATH text() 包含“注冊日期”等等
然后以某種方式找到緊隨其后的下一個元素,但是每次我從頁面中檢索該元素時,它都會以以下形式將其提供給我:
元素="37253116-f015-40a1-bdb1-135342333393"
但我一點也不知道那是什么——更不用說我能用它做什么了。
此外,遺憾的是,Pandas 不會將這段代碼識別為表格,并且在查找表格時會忽略它。如果有人有任何想法,將不勝感激..除非它是通過在 BeautifulSoup 中進行回圈..
<dl class="space">
<dt>MASTER NAME</dt>
<dd>Napoleon</dd>
<dt>BUSINESS TYPE</dt>
<dd>Oxygen farm</dd>
<dt>FILE NUMBER</dt>
<dd>94785394</dd>
<dt>STATUS</dt>
<dd>Active</dd>
<dt>PURPOSE</dt>
<dd> relaxation </dd>
<dt>PLACE INCORPORATED</dt>
<dd> the moon </dd>
<dt>REGISTRATION DATE</dt>
<dd>Dec 8, 1986</dd>
<dt>MAILING ADDRESS</dt>
<dd> fun land <br>
THE MOON
</dd>
</dl>
uj5u.com熱心網友回復:
這個 xpath 應該對你有用 - 它會回傳注冊日期 dt元素的第一個兄弟:
//dl[@class = 'space']/dt[text() = 'REGISTRATION DATE']/following-sibling::dd[1]
然后你可以呼叫方法來獲取這個找到的元素的文本
uj5u.com熱心網友回復:
假設你想要類似下面的代碼,通過 xpath 定位一個元素,然后迭代下一個兄弟元素
from clicknium import clicknium as cc
if not cc.chrome.extension.is_installed():
cc.chrome.extension.install_or_update()
tab = cc.chrome.open("https://www.bing.com/search?q=clicknium")
elem = tab.find_element_by_xpath('//*[@id="b_results"]/li[2]')
while elem != None:
print(elem.get_text())
elem = elem.next_sibling
轉載請註明出處,本文鏈接:https://www.uj5u.com/qianduan/509933.html
上一篇:HTML怎么設定圖片大小
