前言
利用Python爬取回車桌面壁紙壁紙,廢話不多說,
讓我們愉快地開始吧~
開發工具
Python版本: 3.6.4
相關模塊:
requests模塊;
re模塊
以及一些Python自帶的模塊,
環境搭建
安裝Python并添加到環境變數,pip安裝需要的相關模塊即可,
思路分析
目標網址
https://mm.enterdesk.com/dalumeinv/1.html
進入網站后下拉即可看到以下內容:

點擊任意圖片,進入圖片詳情頁,里面為一組圖片,包含大圖和縮略圖:

此網頁禁止滑鼠右鍵,按ctrl+u進行查看網頁源代碼,發現圖片鏈接可在網頁源代碼中獲取;每張圖片有兩條鏈接,對比兩條鏈接發現其中一條多了引數_360_360,而沒有此引數的鏈接為高清原圖,另一條為標清圖!

詳情頁是由首頁鏈接進入的,我們再退到首頁,按ctrl+u進行查看網頁源代碼;發現網頁源代碼中存在進入詳情頁的鏈接,由此可推斷首頁和詳情頁都為靜態加載的網頁!

在首頁下拉網頁,發現其會不斷加載資料,但網址卻沒有發生變化:

但單獨點擊下方翻頁操作,網址會發生變化:

由此可見,進行翻頁操作我們只需要更改網址的引數即可:
https://mm.enterdesk.com/dalumeinv/1.html
https://mm.enterdesk.com/dalumeinv/2.html
https://mm.enterdesk.com/dalumeinv/3.html
核心代碼
def main(html_url): # 傳入首頁url
response = get_response(html_url) # 請求函式接收首頁url并請求資料
urls = re.findall('<a href="(.*?)" target="_blank">.*?</a>', response.text)[31:47] # 提取詳情頁url
for link in urls:
response_ = get_response(link)# 請求函式接收詳情頁url并請求資料
image_url = re.findall('src="(https://up.enterdesk.com/edpic/.*?)"', response_.text)[1:] # 提取圖片url
url_data(image_url) # 回傳圖片url
刪選資料

完整原始碼可以私信獲取
資料保存本地

轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/345760.html
標籤:python
上一篇:【python】——正則運算式
