前言
本文的文字及圖片來源于網路,僅供學習、交流使用,不具有任何商業用途,著作權歸原作者所有,如有問題請及時聯系我們以作處理,
作者:屈希峰,資深Python工程師,知乎多個專欄作者
來源:大資料DT(ID:hzdashuju)
柱狀圖(Histogram)是一種以長方形的長度為變數的表達圖形的統計報告圖,由一系列高度不等的縱向條紋表示資料分布的情況,用來比較兩個或兩個以上的價值(不同時間或者不同條件),只有一個變數,通常用于較小的資料集分析,
柱狀圖也可橫向排列,或用多維方式表達,其主要用于資料統計與分析,早期主要用于數學統計學科中,用柱狀圖表示數碼相機的曝光值,到現代使用已經比較廣泛,比如現代的電子產品和一些軟體的分析測驗,如電腦、數碼相機的顯示幕和Photoshop上都能看到相應的柱狀圖,
1. 基礎柱狀圖
基礎柱狀圖經常用來對比數值的大小,使用范圍非常廣泛,例如科比在不同賽季的得分、不同游戲App下載量、不同時期手機端綜合搜索用戶規模等,圖2-33顯示不同種類水果的銷量,
▲圖2-33 基本柱狀圖
需要注意的是,分類太多不適合使用豎向柱狀圖,如圖2-34所示,
▲圖2-34 豎向柱狀圖
此時,需要用到橫向柱狀圖,如圖2-35所示,
▲圖2-35 橫向柱狀圖
2. 分組柱狀圖
分組柱狀圖,又叫聚合柱狀圖,當使用者需要在同一個軸上顯示各個分類下不同的分組時,需要用到分組柱狀圖,
跟柱狀圖類似,使用柱子的高度來映射和對比資料值,每個分組中的柱子使用不同顏色或者相同顏色不同透明的方式區別各個分類,各個分組之間需要保持間隔,
分組柱狀圖經常用于不同組間資料的比較,這些組都包含了相同分類的資料,例如,展示改革開放以來城鎮與農村人口的變化,不同游戲公司的休閑、益智、格斗類App的下載量對比等,圖2-36對比了2015—2017年間不同水果的銷量,
▲圖2-36 分組柱狀圖
3. 堆疊柱狀圖
與并排顯示分類的分組柱狀圖不同,堆疊柱狀圖將每個柱子進行分割以顯示相同型別下各個資料的大小情況,它可以形象地展示一個大分類包含的每個小分類的資料,以及各個小分類的占比,顯示的是單個專案與整體之間的關系,我們將堆疊柱狀圖分為兩種型別:
1)一般的堆疊柱狀圖:每一根柱子上的值分別代表不同的資料大小,各層的資料總和代表整根柱子的高度,非常適用于比較每個分組的資料總量,
2)百分比的堆疊柱狀圖:柱子的各個層代表的是該類別資料占該分組總體資料的百分比,
堆疊柱狀圖的一個缺點是當柱子上的堆疊太多時會導致資料很難區分對比,同時很難對比不同分類下相同維度的資料,因為它們不是按照同一基準線對齊的,
圖2-37是顯示2015—2017年間不同水果的累計數量,
▲圖2-37 堆疊柱狀圖
4. 雙向柱狀圖
雙向柱狀圖,又名正負條形圖,使用正向和反向的柱子顯示類別之間的數值比較,其中分類軸表示需要對比的分類維度,連續軸代表相應的數值,分為兩種情況,一種是正向刻度值與反向刻度值完全對稱,另一種是正向刻度值與反向刻度值反向對稱,即互為相反數,
圖2-38是顯示2015—2017年間不同水果的進出口數量,
▲圖2-38 雙向柱狀圖
5. 瀑布圖
瀑布圖是由麥肯錫顧問公司所獨創的圖表型別,因為形似瀑布流水而稱之為瀑布圖(Waterfall Plot),此種圖表采用絕對值與相對值結合的方式,適用于表達數個特定數值之間的數量變化關系,圖2-39顯示歷年短跑冠軍的時間跨度,由此可以看出人類體能極限越來越高了,
轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/227684.html
標籤:Python
上一篇:python sqlalchemy 根據資料庫自動生成物體類
下一篇:增強for回圈
