2023年首部爆款劇集《狂飆》一度沖上熱搜第一,害的我兩倍速熬夜看完了,

“是非面前稍不留神,就會步入萬丈深淵,唯有堅守信仰,才能守得初心”

面對這么多廣大網友的討論,我也來湊上一個熱鬧
用python爬取《狂飆》評論資料
代碼展示
部分代碼展示
import requests import parsel # 我還錄制了詳細講解的視頻,直接在這個裙 708525271 自取,包括完整代碼 headers = { 'Cookie': '資料我都洗掉了,建議用自己的', 'Host': '', 'User-Agent': '', } for page in range(0, 4000): print(page) url = f'https://movie.douban.com/subject/35465232/comments?start={page*20}&limit=20&status=P&sort=new_score' response = requests.get(url=url, headers=headers) select = parsel.Selector(response.text) comments = select.css('.comment-item .comment') for comment in comments: name = comment.css('.comment-info a::text').get() try: score_str = comment.css('.comment-info .rating::attr(class)').get() score = score_str.replace('0 rating', '').replace('allstar', '') except: score = 0 comment_time = comment.css('.comment-info .comment-time::text').get().strip() vote_count = comment.css('.comment-vote .votes.vote-count::text').get() comment_content = comment.css('.comment-content span::text').get() print(name, score, comment_time, vote_count, comment_content)
效果展示

不登錄的話,只能采集部分,全部評論需要登錄后才能爬取,
瀏覽器資料容易泄密,我都刪掉了,大家自己修改一下,
最后
感謝你觀看我的文章~本次航班到這里就結束??
希望本篇文章有對你帶來幫助 ??,有學習到一點知識~

躲起來的星星??也在努力發光,你也要努力加油(讓我們一起努力)

轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/543387.html
標籤:Python
