我在網頁上收集體育賽事和結果,首先我要使用Pandas來抓取,但是頁面上有一個選擇“時區”的選項,所以我為自動選擇時區添加了slenium,因此我不知道在使用 slenium 后如何與熊貓一起刮。請大家幫我一個忙,非常感謝。
這是我的作業:
from selenium import webdriver
from selenium.webdriver.support.ui import Select
import pandas as pd
PATH ="C:/Users/XXX/Desktop/chromedriver.exe"
driver = webdriver.Chrome( PATH )
driver.get("https://fixturedownload.com")
select = Select(driver.find_element_by_name("timezone"))
select.select_by_value("SE Asia Standard Time" )
driver.find_element_by_xpath('/html/body/div[2]/div/div[2]/form/div/input[1]').click()
List = pd.read_html(I am stuck here)
uj5u.com熱心網友回復:
要將時區
然后決議回應以提取所需的下載格式鏈接,例如,您可以獲取每個表中所有裝置的 csvs 下載的標題行鏈接,如下所示:
import requests
# import pandas as pd
from bs4 import BeautifulSoup as bs
headers = {'User-Agent': 'Safari/537.36'}
data = {
'timezone': 'Nepal Standard Time',
'command': 'Set Timezone'
}
r = requests.post('https://fixturedownload.com/', headers=headers, data=data)
soup = bs(r.content, 'lxml')
csv_links = ['https://fixturedownload.com' i['href'] for i in soup.select('.fixture tr:nth-child(1) td:nth-child(3) a')]
print(csv_links)
然后,如果標題匹配,您可以組合 csvs,只需下載和存盤,操作等。
使用沒有意義,read_html因為您將失去指向實際資料的鏈接。
轉載請註明出處,本文鏈接:https://www.uj5u.com/shujuku/381175.html
