首先,找到一個皮膚網站,其中一個著名的皮膚網站就是 https://littleskin.cn ,進入網站,我們就會見到一堆皮膚,這就是今天我們要爬的皮膚,給各位分享一下代碼,
PS:另外很多人在學習Python的程序中,往往因為遇問題解決不了或者沒好的教程從而導致自己放棄,為此我整理啦從基礎的python腳本到web開發、爬蟲、django、資料挖掘等【PDF等】需要的可以進Python全堆疊開發交流.裙 :一久武其而而流一思(數字的諧音)轉換下可以找到了,里面有最新Python教程專案可拿,不懂的問題有老司機解決哦,一起相互監督共同進步
import requests
import re
import time
import json
download_sucess = True
time.sleep(1.5)
pictures = input('你想下載多少張皮膚:')
while pictures.isdigit() == False:
print("請輸入數字!")
pictures = input('你想下載多少張皮膚:')
Path = input('請輸入保存的路徑:')
print("請稍等......")
pictures = int(pictures)
for i in range(1,pictures+1):
url = 'https://littleskin.cn/skinlib/data?filter=skin&uploader=0&sort=likes&keyword=&page=' + str(i)
response = requests.get(url).json()
ids = re.findall("'tid': (.*?),",str(response))
for id in ids:
picture_url = 'https://littleskin.cn/preview/' + id + '.png'
picture_name = picture_url.strip('https://littleskin.cn/preview/')
picture = requests.get(picture_url).content
try:
with open(Path + '//%s'%picture_name,'wb') as file:
file.write(picture)
except FileNotFoundError:
download_sucess = False
print('路徑不存在!')
break
if download_sucess == False:
print("下載失敗!")
elif download_sucess == True:
print('下載完成!')
最終效果:
皮膚爬取的原理是通過 json 格式來查看網站的每一張圖片的 id 號,再用拼接的方式組成一個圖片地址,最后再用二進制的方式把圖片存放在我們的檔案夾里,希望各位能通過這篇文章學到東西,
總結:很多人在學習Python的程序中,往往因為遇問題解決不了或者沒好的教程從而導致自己放棄,為此我整理啦從基礎的python腳本到web開發、爬蟲、django、資料挖掘等【PDF等】需要的可以進Python全堆疊開發交流.裙 :一久武其而而流一思(數字的諧音)轉換下可以找到了,里面有最新Python教程專案可拿,不懂的問題有老司機解決哦,一起相互監督共同進步
本文的文字及圖片來源于網路加上自己的想法,僅供學習、交流使用,不具有任何商業用途,著作權歸原作者所有,如有問題請及時聯系我們以作處理,
轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/206659.html
標籤:Python
