手把手教你使用Python抓取QQ音樂資料（第一彈）-有解無憂

【一、專案目標】

獲取 QQ 音樂指定歌手單曲排行指定頁數的歌曲的歌名、專輯名、播放鏈接，

由淺入深，層層遞進，非常適合剛入門的同學練手，

【二、需要的庫】

主要涉及的庫有：requests、json、openpyxl

【三、專案實作】

1.了解 QQ 音樂網站的 robots 協議

只禁止播放串列，可以操作，

2.進入 QQ 音樂主頁 https://y.qq.com/

3.輸入任意歌手，比如鄧紫棋

4.打開審查元素（快捷鍵 Ctrl+Shift+I）

5.分析網頁源代碼 Elements，發現無歌曲資訊，無法使用 BeautifulSoup，如下圖所示，結果為空，

6.點擊 Network，看資料在不在 XHR（無重繪更新頁

面），我的經驗是先看 Size 最大的，然后分析 Name，

查看 Preview，果然在里面！

7.點擊 Headers，拿到相關引數，如下圖，仔細觀察

url 與 Query String Parameters 引數的關系，發現

url 中的 w 代表歌手名，p 代表頁數，

8.通過 json 代碼實作，首先小試牛刀，爬取第一頁

的資料，url 直接復制過來，成功！

9.引入 params 引數，實作指定歌手、指定頁數的查詢，

注意代碼url為上一步url中“？”之前的部分， params兩邊的引數都需要加 ’’,requests.get 添加 params，引數（也可順便添加 headers 引數）

【四、總結】

1.爬取 QQ 音樂比爬取豆瓣等網站稍難，所需資訊不在網頁源代碼，需查看 XHR；

2.通過 XHR 爬取資料一般要使用 json，格式為：

res = requests.get(url)

json = res.json()

list = json[‘’][‘’]…

3.僅供練手參考，不建議爬取太多資料，給服務器增大負載；

4.Python 爬取 QQ 音樂資料（二）將為大家帶來如何爬取指定歌曲的歌詞及評論（selenium），并生成詞云圖（wordcloud），敬請期待，

5.需要本文原始碼的話，請在公眾號后臺回復“QQ音樂”四個字進行獲取，

看完本文有識訓？請轉發分享給更多的人

IT共享之家

入群請在微信后臺回復【入群】

想學習更多Python網路爬蟲與資料挖掘知識，可前往專業網站：http://pdcfighting.com/

轉載請註明出處，本文鏈接：https://www.uj5u.com/houduan/114467.html

標籤：Python