如何將從湯物件中抓取的日期保存到Csv中-有解無憂

我希望將抓取的日期保存到 csv 檔案中，這是抓取的資料和代碼

url = "https://cf-courses-data.s3.us.cloud-object-storage.appdomain.cloud/IBM-DA0321EN- 
SkillsNetwork/labs/datasets/Programming_Languages.html"
from bs4 import BeautifulSoup 
import requests
data  = requests.get(url).text 
soup = BeautifulSoup(data,"html5lib")
table = soup.find('table')
for row in table.find_all('tr'): 

    cols = row.find_all('td') 
    programing_language = cols[1].getText()
    salary = cols[3].getText() 
    print("{}--->{}".format(programing_language,salary))

我只想保存抓取的資料。

uj5u.com熱心網友回復：

這是解決方案。

import pandas as pd
from bs4 import BeautifulSoup
import requests
data=[]
url = "https://cf-courses-data.s3.us.cloud-object-storage.appdomain.cloud/IBM-DA0321EN-SkillsNetwork/labs/datasets/Programming_Languages.html"
from bs4 import BeautifulSoup 
import requests
data  = requests.get(url).text 
soup = BeautifulSoup(data,"html5lib")
table = soup.find('table')
for row in table.find_all('tr'): 

    cols = row.find_all('td') 

    programing_language = cols[1].getText()

    salary = cols[3].getText() 
    data.append([programing_language,salary])

    #print("{}--->{}".format(programing_language,salary))

cols=['programing_language','salary']
df = pd.DataFrame(data,columns=cols)
df.to_csv("data.csv", index=False)

uj5u.com熱心網友回復：

對于輕量級解決方案，您只需使用csv. 使用忽略標題行tr:nth-child(n 2)。此nth-child范圍選擇器從第二個tr. 然后在后續行的回圈中，選擇第二列和第四列，如下所示：

from bs4 import BeautifulSoup as bs
import requests, csv

response = requests.get('https://cf-courses-data.s3.us.cloud-object-storage.appdomain.cloud/IBM-DA0321EN-SkillsNetwork/labs/datasets/Programming_Languages.html',
                        headers={'User-Agent': 'Mozilla/5.0'})
soup = bs(response.content, 'lxml')

with open("programming.csv", "w", encoding="utf-8-sig", newline='') as f:

    w = csv.writer(f, delimiter=",", quoting=csv.QUOTE_MINIMAL)
    w.writerow(["Language", "Average Annual Salary"])

    for item in soup.select('tr:nth-child(n 2)'):
        w.writerow([item.select_one('td:nth-child(2)').text,
                   item.select_one('td:nth-child(4)').text])

轉載請註明出處，本文鏈接：https://www.uj5u.com/net/352890.html

標籤：Python 文件美汤

上一篇：使用C#將資料拆分為csv中的兩列

下一篇：對CSV檔案進行排序并將結果另存為CSV