前言??
本文的文字及圖片來源于網路,僅供學習、交流使用,不具有任何商業用途,如有問題請及時聯系我們以作處理,
前文內容??
Python爬蟲入門教程01:豆瓣Top電影爬取
Python爬蟲入門教程02:小說爬取
Python爬蟲入門教程03:二手房資料爬取
Python爬蟲入門教程04:招聘資訊爬取
Python爬蟲入門教程05:B站視頻彈幕的爬取
Python爬蟲入門教程06:爬取資料后的詞云圖制作
Python爬蟲入門教程07:騰訊視頻彈幕爬取
Python爬蟲入門教程08:爬取csdn文章保存成PDF
Python爬蟲入門教程09:多執行緒爬取表情包圖片
Python爬蟲入門教程10:彼岸壁紙爬取
Python爬蟲入門教程11:新版王者榮耀皮膚圖片的爬取
Python爬蟲入門教程12:英雄聯盟皮膚圖片的爬取
Python爬蟲入門教程13:高質量電腦桌面壁紙爬取
Python爬蟲入門教程14:有聲書音頻爬取
Python爬蟲入門教程15:音樂網站資料的爬取
Python爬蟲入門教程17:音樂歌曲的爬取
PS:如有需要 Python學習資料 以及 解答 的小伙伴可以加點擊下方鏈接自行獲取
python免費學習資料以及群交流解答點擊即可加入
基本開發環境??
- Python 3.6
- Pycharm
相關模塊的使用??
import os
import requests
安裝Python并添加到環境變數,pip安裝需要的相關模塊即可,
一、??確定需求

爬取搞笑趣味欄目的視頻內容,
二、??網站資料分析
首先需要明確一點,好看視頻網站加載方式是懶加載的方式,需要你下滑網頁才會加載出新的內容

加載出來的內容里面有音頻播放地址以及標題,
內容比較簡單,看代碼就行
import os
import requests
url = 'https://haokan.baidu.com/videoui/api/videorec?tab=gaoxiao&act=pcFeed&pd=pc&num=20&shuaxin_id=1612592171486'
headers = {
'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'
}
response = requests.get(url=url, headers=headers)
json_data = https://www.cnblogs.com/Qqun821460695/p/response.json()
videos = json_data['data']['response']['videos']
for index in videos:
title = index['title']
play_url = index['play_url']
video_content = requests.get(url=play_url, headers=headers).content
path = 'video\\'
if not os.path.exists(path):
os.mkdir(path)
with open(path + title + '.mp4', mode='wb') as f:
f.write(video_content)
print('正在保存:', title)


轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/260863.html
標籤:Python
