在學風變編程的爬蟲課程,練習是這樣的:
你需要爬取的是博客【人人都是蜘蛛俠】中,《未來已來(四)——Python學習進階圖譜》文章的默認評論頁,并且列印。
文章URL:
https://wordpress-edu-3autumn.localprod.oc.forchange.cn/all-about-the-future_04/
我的代碼寫完之后只爬出來一條資料(我懷疑可能是find_all的class寫的問題),然后呢還有就是說,沒辦法以text形式完全展現
只能以tag的形式展現,otherwise就會報錯AttributeError: 'NoneType' object has no attribute 'text'
我的代碼長這樣:
import requests
from bs4 import BeautifulSoup
res = requests.get('https://wordpress-edu-3autumn.localprod.oc.forchange.cn/all-about-the-future_04/')
html = res.text
soup = BeautifulSoup(html, 'html.parser')
items = soup.find_all(class_='comments-area')
for item in items:
kind = item.find('h2')
idcode = item.find(class_='comment-body')
time = item.find('datetime')
content = item.find(class_='comment-content')
print(kind,'\n',idcode,'\n',time,'\n',content)
#這里如果我輸入print(kind.text,'\n',idcode.text,'\n',time.text,'\n',content.text),就會出現AttributeError: 'NoneType' object has no attribute 'text'
求問大神幫看看是什么原因?
蟹蟹
uj5u.com熱心網友回復:
你提取出來的是空值吧,所以沒有text屬性,先判斷一下吧uj5u.com熱心網友回復:
大膽點,去掉吧字。提取的就是空置,所以沒有text屬性。uj5u.com熱心網友回復:
這種情況,樓上說出了現象,卻沒有說出根本所在,恭喜你,你被反爬了
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/240204.html
上一篇:對docx提取內容的特殊情況
