所以我嘗試使用 Web Scraping 的頁面是私有的。它使用雙向身份驗證,這不會讓我通過 selenium 打開鏈接。當我手動打開頁面時,不會要求我進行額外的身份驗證。
Page is self 對頁面上的所有表格使用相同的類,并且 td 標記中的類也大多相同。
這是我不想提取的資料表
這是同一頁面上的另一個表,我不需要,但大多具有相同的類和標簽
為了使這更簡單一點,沒有添加其他屬性或任何東西真的讓我很生氣。既然不是這樣,我真的不知道如何繼續獲取資料。
真正開放的任何想法。提前謝謝
uj5u.com熱心網友回復:
首先,如果資料總是在同一個順序,你可以嘗試使用一個css選擇器,比如driver.find_element(By.CSS_SELECTOR, "tr > td:nth-child(3)")獲取第一個tr中的第三個td。
如果它不起作用,而您的目標是獲取與表中某個鍵相關的資訊,則可以進行回圈以將表中的所有資料收集到一個字典中,然后呼叫您想要的鍵。
轉載請註明出處,本文鏈接:https://www.uj5u.com/qiye/497450.html
上一篇:定位具有動態屬性的元素
