我使用 Python、Selenium 和 BeautifulSoup 構建了一個 LinkedIn 網路爬蟲,它接收公司的 Linkedin URL 并輸出有關公司的資訊,例如其競爭對手。
我遇到的問題是我的輸入是公司名稱串列。有沒有辦法可以將此公司名稱串列轉換為可以輸入網路爬蟲的 LinkedIn URL 串列?謝謝你。
uj5u.com熱心網友回復:
我認為這會奏效:
url = "https://www.linkedin.com/company/" company_name
讓我們說“https://www.linkedin.com/company/apple/”
uj5u.com熱心網友回復:
使用串列推導:
companies = ['companyA','companyB','companyC']
['https://www.linkedin.com/company/' c for c in companies]
輸出:
['https://www.linkedin.com/company/companyA', 'https://www.linkedin.com/company/companyB', 'https://www.linkedin.com/company/companyC']
或直接迭代:
companies = ['companyA','companyB','companyC']
for company in companies:
url = 'https://www.linkedin.com/company/' company
#perform a request
#scrape what you need
轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/405012.html
標籤:
下一篇:如何在回圈元素時重新加載頁面?
