作者|PRANAV DAR
編譯|VK
來源|Analytics Vidhya
概述
-
影片可視化是一種藝術,它很容易在Tableau中創造出來
-
我們將在這里使用開源資料集,并在Tableau中創建自己的影片可視化
介紹
我是影片視徑訓的超級粉絲,我喜歡資料點在我螢屏上跳舞的方式,他們用線條和點來講述他們自己的故事,設計一個影片是一種藝術,
我經常用影片形象來展示板球比賽的進展,或籃球的點數,或足球傳球比賽的演變(是的,我是個體育迷),
在我的作業表上,看著這些點互相交談,并取得進展,這是十分愉快的事情,
相信我,一旦你開始在Tableau中構建這些影片的可視化效果,就沒有回頭路了,你會像我一樣上癮,想找任何借口把影像轉換成影片形式,

我收到了很多來自社區成員和學生的要求,如何使影片可視化,
所以我決定為大家寫這篇文章,這是一個簡單的前提——我們將使用開源資料,并嘗試創建漢斯·羅斯林的標志性可視化,
https://www.youtube.com/watch?v=jbkSRLYSojo
以下是我們將在Tableau中構建的影片可視化體驗:
https://cdn.analyticsvidhya.com/wp-content/uploads/2020/06/animated_visualization_tableau.mp4?_=1
目錄
-
為什么要使用影片可視化?
-
理解問題陳述
-
在Tableau中設定影片可視化的資料
-
在Tableau中創建我們自己的影片可視化
-
我們如何改進這種影片效果?
為什么要使用影片可視化?
這是一個關鍵的問題——當我們有太多的選擇來創建可視化效果時,我們為什么要選擇影片呢?這些在這個行業有用嗎?
影片圖表由于其美觀的特性在資料可視化社區中很受歡迎,誰不喜歡看一個動態圖表來描述趨勢是如何隨著時間而改變的?

但除了它們明顯的令人賞心悅目的特性之外,影片形象化在這個行業中也確實有效,無論是金融、營銷還是體育,Tableau對制作影片圖表的解釋:
“如果沒有影片,更改日期過濾器之類的內容會導致散點圖示記突然跳轉到新位置,很難確定是什么改變了或者為什么改變了,但是一個平滑的影片連接了這些點,
影片使得更容易發現和理解變化,比如當一個特定的標記變成一個例外值時,當出現突然的值尖峰或下降時,或者當資料簇出現時,
可視化可以感知條形圖如何相對彼此生長、收碩訓重新排序,或者跟蹤單個標記的路徑,
影片通過喚起對重要內容的關注并將觀眾的注意力引導到重要的地方來澄清分析,它們可以幫助你和其他人了解不斷發展的資料背后的原因和方式,”
簡而言之,經過深思熟慮設計的影片可視化可以增強我們對資料的理解,
理解問題陳述
我們將使用開源資料集在Tableau中構建影片可視化效果,這是讓更多觀眾了解的最好方法,你可以拿起資料集并立即開始處理它們,或者在我們學習本教程時,你也可以跟著我,
在這里,我們將致力于創造一個生動的可視化,
隨著時間的推移,顯示各國期望壽命與人均收入之間的關系,
這是一個非常有趣的專案,其目的是分析這兩個特征是否相關,以及不同國家在期望壽命和人均收入方面的比較,
正如我所說,這是受到漢斯·羅斯林(Hans Rosling)宏偉可視化的啟發,我們將使用與他的組織Gapminder為社區提供的開源資料相同的資料,
我們將主要使用四個資料集:
- life_expectancy_years:包含每個國家預期壽命的資料
- income_per_person_gdppercapita_ppp_inflation_adjusted:人均國內生產總值(根據購買力差異調整)
- population_total:每個國家的總人口
- countries_total:包含國家名稱、地區名稱(大陸)、國家代碼和其他資訊
所有資料集包含1800年至今的年度資訊,你可能會看到一些空值,
你能猜出為什么是這樣嗎?那是因為有些國家是在1800年后的某個時候建立的,因此,在某些列中會有空白值,
你可以從Gapminder的優秀站點下載所有資料集,
https://www.gapminder.org/data/
注意,到有些人找不到國家資料集,你可以在這里下載
https://cdn.analyticsvidhya.com/wp-content/uploads/2020/06/countries_total.csv
在Tableau中設定影片可視化的資料
好了,是時候開始了!
在這里,我們將把所有的資料集匯入Tableau,并在開始構建影片可視化之前執行一些預處理步驟,
讓我們從預期壽命資料集開始(對于其他資料集,匯入步驟將相似),
首先,使用Tableau主頁上的“Connect”選項將這個Excel檔案匯入Tableau,你應該看到出現了:

這有很多值!我們的表頭出現在第一排,讓我們通過右鍵單擊“life_expectancy_years ”按鈕并選擇“Field names are in first row”來解決這個問題:

太好了-修好了,接下來,我想把這些值卷成一列,這樣我就更容易分析資料并創建影片可視化效果,
我們將使用Tableau的“pivot”選項對此進行幫助,
只需選擇所有列(第一列除外),右鍵單擊列標題,然后選擇“Pivot”:

注意:只有在匯入Excel(.xlsx)檔案時,“Pivot”選項才會顯示,對于任何其他檔案格式,你都無法獲得此選項,
你需要使用Tableau Prep首先將其轉換為Pivot,然后將其匯入到Tableau桌面,
接下來,讓我們更改列名以反映它們所代表的內容,只需右鍵單擊列標題并選擇“重命名”:

你可以對其他三個資料集執行相同的步驟,不要忘記重命名列,因為我們將使用其中一個列作為連接所有四個資料集的主鍵,
執行完上述步驟后,其他資料集應該是這樣的:
income_per_person_gdppercapita_ppp_inflation_adjusted

population_total:

讓“countries_total”資料集保持原樣,你會注意到標題已經是正確的,我們不需要在這里轉換任何東西,當我們在Tableau中匯入資料集時,它將是這樣的:

我們的資料現在已經準備好并準備好創建可視化,
在Tableau中創建我們自己的影片可視化
現在翻到“Sheet 1”,把它改名為“Life Expectancy vs. GDP per Capita”,根據你的作業給表命名是很重要的,
當我們處理多個作業表時(這在行業中經常發生),很重要的一點是,名稱要定義得與內容一致,這樣我們就可以很容易地找到我們要尋找的可視化效果,
我們可以在Tableau作業表的左上角看到匯入的四個資料集,在開始使用任何變數之前,我們需要建立四個資料集之間的關系,以便Tableau知道這些資料集是相互關聯的,
要執行此操作,請單擊Tableau視窗頂部的“Data”按鈕,然后選擇“Edit Blend Relationships”:

接下來,將‘Life Expectancy (Years)’特征拖放到行書架中,將“GDP per Capita”拖放到列中:

接下來,我們需要執行三個快速拖放操作,將“Population”維度放入“Marks”部分下的“Size”按鈕,把“region”放進“Color”,把“Country”放進“Details”,這就是你的可視化效果:

我們的影像開始成形了!但我們這里有個問題-軸的值很大,X軸和Y軸的高度都高得離譜,在我們做其他事情之前先把它修好,
我打算把預期壽命定在20到90歲之間,右鍵單擊Y軸并選擇“編輯軸”,單擊“Fixed”選項并輸入值:

對人均GDP做同樣的事情,我們將把它固定在200到60000美元之間(并選擇對數選項),我們現在將得到一張空白作業表,
別擔心,我們很快就會把資料點找回來的!
在Tableau查看影片!
是時候看表演了,我們將使用“頁面”工具架在Tableau中設定可視化影片,
這個頁面架幫助我們將可視化分解成一系列頁面,從而創建影片,
每個頁面都是一個獨特的視圖,并且基于我們放置在頁面架上的欄位的一個成員,
當我們想展示點隨時間的移動時,頁面是十分適合的,這正是我們在這里要做的,我們希望預期壽命和人均國內生產總值隨著時間的推移而變化,
因此,將“Years”特征拖放到“Pages ”工具架中,然后選擇“‘Add all members”:

我們的資料點回來了!你也會注意到一個滑動條出現在右手邊,那是你的頁面架發揮它的作用,接下來,從右側拖動“Pages ”選單,并將其放在左側的“Pages ”工具架下:

這些氣泡的大小現在太小了,我們可以通過單擊“標記”部分下的“大小”按鈕并增大大小來輕松增加此值,此外,如果選擇了“形狀”,請將可視化設定更改為“圓形”:

很好!讓我們把這些國家的名字也可視化,將“Country”值拖放到“Labels”中:

看起來不錯,我們剩下要做的就是看影片的效果,非常簡單,只需按下頁面部分的“Play”按鈕,就可以看到影片:
https://cdn.analyticsvidhya.com/wp-content/uploads/2020/06/animated_tableau_visualizations.mp4?_=2
并且還有你自己的影片畫面!
我們如何改進這種影片效果?
我們可以做很多事情來增強這種可視化效果,
首先,我們可以做更細致的分析,我們可以拿幾個國家,比如印度、中國、英國、美國、巴西等,看看這些年來人均預期壽命與GDP的關系如何,
或者,我們可以逐個地區,分析每一個大陸如何以自己的權利行事,有這么多的細節,我們可以從這個影片可視化提取!
在這個資料集之外,我鼓勵你在Tableau中使用不同的選項:
-
嘗試不同的圖表-當我們設定一個折線圖的影片時,看看它在Tableau中是如何變化的
-
一個非常酷的可視化方法是使用影片來隨時間變化查看地圖,(你可以使用Tableau的Superstore資料集進行此操作)
-
拿起你以前做過的任何一個專案,利用你在這里學到的東西來改進它
-
試試儀表板,想象一下當你向觀眾展示時,影片儀表板的力量!
老實說,在定制和播放影片方面,你想做什么就做什么,
結尾
如果使用正確的方式和正確的受眾,影片可視化可以是一個非常強大的工具,如果我們精心制作和設計圖表,我們就有能力說服我們的聽眾,
原文鏈接:https://www.analyticsvidhya.com/blog/2020/06/animated-data-visualization-tableau-5-minutes/
歡迎關注磐創AI博客站:
http://panchuang.net/
sklearn機器學習中文官方檔案:
http://sklearn123.com/
歡迎關注磐創博客資源匯總站:
http://docs.panchuang.net/
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/6851.html
標籤:其他
上一篇:機器學習中的AUC-ROC曲線
下一篇:神經機器翻譯的直觀解釋
