emmm~
起因呢,這昨晚女同桌跟我說電腦有點卡,喊我去宿舍給她裝個新系統,裝系統就裝系統吧,結果又說新系統表情包都沒保存~
我當時就有點生氣,真當我是萬能的呢?
于是我直接就用Python給她爬了幾十個G,完事扭頭就走,任她怎么喊我也沒用!

一、準備作業
使用的環境
- python3.8 | Anaconda
- pycharm
使用的模塊
- requests 第三方模塊 需要手動安裝
- re 內置模塊不需要安裝
win+r 輸入cmd ,確定后新視窗輸入 pip install requests 即可安裝成功,
插件安裝
xpath helper擴展工具包
安裝步驟:找助理老師獲取xpath helper擴展工具包(注意:不要解壓)
》》 打開Google瀏覽器 --> 更多工具 --> 擴展程式 --> 打開開發者模式 --> 把xpath helper擴展工具包直接拖入 --> 重繪
使用方法:快捷鍵 ctrl+shift+X
思路流程
1、分析資料來源
第一頁:https://fabiaoqing.com/biaoqing/lists/page/1.html
多頁 —> 第一頁 --> 一個
2、實作代碼
- 發送請求,第一頁資料
- 獲取資料
- 決議資料,表情
- 保存資料
二、效果展示
部分效果展示

三、代碼決議
1、發送請求
第一頁資料
url = 'https://fabiaoqing.com/biaoqing/lists/page/1.html' headers = { # 鍵值對 用戶代理 瀏覽器的基本身份 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/103.0.0.0 Safari/537.36' } response = requests.get(url, headers=headers) # <Response [200]> 回應物件 200 狀態 成功 404 403 print(response)
2、獲取資料
網頁源代碼
print(response.text)
re 找規律
3、決議資料
.*? 精準匹配資料
re_data = https://www.cnblogs.com/hahaa/archive/2022/09/14/re.findall('<img data-original="(.*?)" src="https://img.uj5u.com/2022/09/15/322389150656393.gif" title="(.*?)" ', response.text) # print(re_data) # for 回圈 for img in re_data: # print(img) #索引 [0] [1] () # 單個表情包鏈接 link = img[0] suffix = link.split('.')[-1] # print(suffix) # print(link) # 名字 title = img[1] title = re.sub(r'[\/:*?"<>|]','',title) # 二進制 content = requests.get(link, headers=headers).content # print(content)
4、保存資料
with open('表情包\\' + title +'.' +suffix, mode='wb') as file: file.write(content) # 我也錄制了對應的視頻詳細講解,完整代碼和視頻都放在這個裙了 279199867
好了,今天的分享就到這里~
最后給大家分享一套Python教程:Python實戰100例,希望對大家有所幫助!

轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/508075.html
標籤:其他
上一篇:python 模塊、原始字串
