本文的文字及圖片來源于網路,僅供學習、交流使用,不具有任何商業用途,著作權歸原作者所有,如有問題請及時聯系我們以作處理

Python 資料分析練習講解:資料可視化
https://www.bilibili.com/video/BV1sK4y1E77C/
前言
2020年的最后一段時間里,大家都在期盼著新一年到來的日子里,又有一位重量級的女明星宣布結束了自己的婚姻,12月23日中午,周迅和高圣遠在微博中向大家宣布了自己的離婚的訊息,一時間成為了微博的沸點話題,大家為他們感到惋惜的同時,也祝福兩人以后都能夠各自安好,擁有自己美好的人生,
其實離婚的話題,在我們的日常生活中,已經不算是非常新鮮的話題了,根據民政部門的大資料顯示,我國的離婚率已經連續8年升高,而結婚率已經連續5年下降,為了更好的幫助大家了解目前我國的離婚率現狀,我們通過資料的可視化展示,來直觀的展現給大家,
1
資料獲取
對于資料的獲取,可以直接到國家統計局的官方網站進行獲取,網址為:
https://data.stats.gov.cn/easyquery.htm?cn=C01&zb=A0P0C&sj=2019
由于國家統計局的資料都是面向公眾開放的,因此我們不必利用爬蟲程式進行爬取,可以直接從網站上進行下載,如下圖所示:
這里下載的資料是針對于全國的情況進行統計的,我們還可以分省年度報名中,下載每個省市的離婚資訊的年度報表,
2
資料分析
1).資料的初步分析
獲取到資料之后,我們先來對全國的離婚資訊進行了解,
從上面的資訊可以看到統計的資訊中包含了結婚登記、內地居民登記結婚、離婚登記等等資訊的統計,而這里的粗離婚率指的是年度離婚數與總人口之比,對應到我們上圖的資料中,以2019年為例,粗離婚率是千分之3.36,也就是說在1000個人當中有3.36人會離婚,
2).資料可視化
俗話說“字不如表,表不如圖”,我們接著利用圖表來看一下,近十年來我國的粗離婚率的變化情況,
我們將全國資料中的年份資訊和粗離婚率的資訊提取出來,并命名為x_data和y_data,然后利用pyecharts中的Line類來繪制可視化結果,結果如下:
可以看到,我國的粗離婚率隨著時間的發展而不斷的攀升,從2010年到2019年這十年間,粗離婚率翻了近1.7倍,
3).離婚率的統計
從全國的資料中,可以看到,2019年,我國的粗離婚率的平均數值為3.36,我們來統計一下,全國31個省市自治區中,位于平均數值的省市數量的分布情況,
程式首先提取了各個省市自治區資料中,2019年粗離婚率資料,然后根據均值的大小來進行判斷統計,最后利用Pie類來進行可視化的展示,
從可視化的統計結果來看,我們可以得到以下幾點結論,大于3.36的省市數量和小于3.36的省市數量幾乎是旗鼓相當,沒有一個城市的粗離婚率恰好等于3.36,并且粗離婚率大于3.36的城市為16個,所以說全國范圍內離婚率都處在一個較為平衡的范圍內,并沒有哪一個省市的離婚率較為突出,
04).北京 VS 上海 離婚率
雖然北京上海在離婚率上不是很突出,但是我們還是可以來針對這兩個城市來做一個針對性的對比,利用Altair庫來看一下,北京和上海近十年的離婚率對比情況,
程式首先讀取北京市和上海市的粗離婚率資料,然后提取并構造年份、城市等資料,并整合為DataFrame格式的資料,然后通過Altair庫來構造可視化柱狀圖,運行上述程式,得到以下的結果,
可以看出,北京和上海的離婚率從各自的城市出發,呈現規律性的波動,總是連續幾年增長后迅速回落,然后再次慢慢增長,而且有趣的是,兩個城市的波動規律幾乎是完全相同的,而從兩個城市對比的角度來看,北京的粗離婚率總是高于上海,
轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/239902.html
標籤:其他
