我想用BeautifulSoup從一個html串列中提取 "我想要什么"。
<ul class="two-columns"/span>>
<li class="two-columns_a"/span>>
<span> Something1: </span><span class="red"> What I want</span>
</li>
<li class="two-columns_a">
<span> Something2: </span><span class="red"> What I want</span>
</li>
<li class="two-columns_a">
<span> Something3: </span><span class="red"> What I want</span>
</li>
</ul>
到目前為止,我做了類似的事情,但它在span標簽之間回傳兩個值。
data['something1'] = soup.select("li.two-columns_a") [0].text.strip()
data['something2'] = soup.select("li.two-columns_a") [1].text.strip()
data['something3'] = soup.select("li.two-columns_a") [2].text.strip()
預先感謝您的幫助,
uj5u.com熱心網友回復:
假設data是作為一個字典,你可以試試:
data= {}.
for target in soup.select('ul.two-columns li.two-columns_a') 。
data[target.select_one('span:nth-child(1)').text]=(target.select_one('span:nth-child(2)') .text)
資料
輸出應該是:
。{' Something1: ': '我想要什么'。
' Something2: ': '我想要的東西'。
' Something3: ': '我想要的東西'}。
轉載請註明出處,本文鏈接:https://www.uj5u.com/qianduan/320252.html
標籤:
上一篇:蟒蛇美麗的湯刮
下一篇:使用VBA刮取實時資料
