你有沒有體會過這種感受:一個人一直在你的心里活了很久很久,哪一天突然抽離了,整個人都像被抽空了一樣,茫然無措,就算積木沒了底層,像畫圓沒了圓心…
原來一直的鐵直女堅強形象,也并不是那么堅不可摧,
我失戀了…

一直在回圈著任然的《無人之島》,越聽越難受,突發奇想,我想看看現在有多少人像我一樣難受著,于是用Python去爬取網易云上面的《無人之島》的評論,以為找點事情做可以不想那么多,結果看完評論更難受了,
一、效果
先給你們看看《無人之島》爬下來的詞圖,


看完這個詞圖,你們知道我在想什么嗎?每一個詞我都能想到過去的點滴,
活得很累,但是不敢死,夜晚的時間太長了,足夠應付難過的情緒,天一亮就又是假裝快樂的一天,我所厭惡的不是愛情,而是那等待,猜測,道歉和傷害,以及那無法兌現的承諾,

我把這個技能分享給你們,我們一起去網易云潸然淚下…
二、用到的技術
1.無頭瀏覽器selenium
Selenium是一個用于Web應用程式測驗的工具,Selenium測驗直接運行在瀏覽器中,就像真正的用戶在操作一樣,不會被要爬的網站產生懷疑,
2.selenium的優勢
自動渲染所有回應內容,可以直接繞過js加密的操作,只要是展示在瀏覽器上看的資料,都可以使用無頭瀏覽器獲取,幾乎可以達成可見即可爬,
3.使用到的第三方庫
jieba庫、wordcloud庫、MySQLdb、numpy庫,
三、原始碼分析
1.爬取評論進庫部分,

2.進行效果圖展示可視化,

四、爬取任意歌曲評論
不僅僅可以爬任然的《無人之島》,還可以爬其他的歌曲,方法都是差不多的,
1.請求的url
首先,我們代碼里面有一條請求網址的url,也就是地址欄的那一串地址,需要宣告一點,僅限網頁版的網易云音樂官網的歌曲,示例圖如下:

2.需要爬取的評論

今天的分享就到這里了,
愛一個人,原是愛到七分就夠了,還有三分要留著愛自己,愛太滿了,對他而言不是幸福,而是負擔,世上的道理,原都是這么簡單,無論是愛物,還是愛人,都要有節制,月滿則虧,水滿則溢,有時,太多的愛不是愛,而是巨大的傷害,
時間是最好的魔法師,在它的手里,每個人都在不知不覺的改變中悄悄成長,堅守著自己的秘密,在孤獨和痛苦里,在寂寞無助中,懂得溫暖別人、安慰自己、學會堅強,生命原本脆弱,但我們必須堅強地活著,
生命原本孤獨,但世界一樣擁擠,那就這樣吧,

我這有一些Python學習資料,我也是從別人那里拿的,如果你用的到的話可以免費拿走,群號41683711,


轉載請註明出處,本文鏈接:https://www.uj5u.com/ruanti/286635.html
標籤:其他
