本文的文字及圖片來源于網路,僅供學習、交流使用,不具有任何商業用途,著作權歸原作者所有,如有問題請及時聯系我們以作處理,
以下文章來源于CDA資料分析師 ,作者CDA資料分析師
前言
《世界幸福指數報告》是對全球幸福狀況的一次具有里程碑意義的調查,
民意測驗機構蓋洛普從2012年起,每年都會在聯合國計劃下發布《世界幸福指數報告》,報告會綜合兩年內150多個國家的國民對其所處社會、城市和自然環境等因素進行評價后,再根據他們所感知的幸福程度對國家進行排名,
《世界幸福指數報告》的編撰主要依賴于對150多個國家的1000多人提出一個簡單的主觀性問題:“如果有一個從0分到10分的階梯,頂層的10分代表你可能得到的最佳生活,底層的0分代表你可能得到的最差生活,你覺得你現在在哪一層?”
那么哪個國家在總體幸福指數上排名最高?
哪些因素對幸福指數的影響最大?
今天我們就帶你用Python來聊一聊,
資料理解
關鍵欄位含義解釋:
1. rank:幸福指數排名
2. region:國家
3. happiness:幸福指數得分
4. gdp_per_capita:GDP(人均國內生產總值)
5. healthy_life_expectancy:健康預期壽命
6. freedom_to_life_choise:自由權
7. generosity:慷慨程度
8. year:年份
9. corruption_perceptions:清廉指數
10. social_support:社會支持(客觀上物質上的援助和直接服務;主觀上指個體感到在社會中被尊重、被支持和被理解的情緒體驗和滿意程度,)
資料匯入和資料整理
首先匯入所需包,
# 讀入資料
df_2015 = pd.read_csv('./deal_data/2015.csv')
df_2016 = pd.read_csv('./deal_data/2016.csv')
df_2017 = pd.read_csv('./deal_data/2017.csv')
df_2018 = pd.read_csv('./deal_data/2018.csv')
df_2019 = pd.read_csv('./deal_data/2019.csv')
# 新增列-年份
df_2015["year"] = str(2015)
df_2016["year"] = str(2016)
df_2017["year"] = str(2017)
df_2018["year"] = str(2018)
df_2019["year"] = str(2019)
# 合并資料
df_all = df_2015.append([df_2016, df_2017, df_2018, df_2019], sort=False)
df_all.drop('Unnamed: 0', axis=1, inplace=True)
df_all.head()
# 讀入資料
df_2015 = pd.read_csv('./deal_data/2015.csv')
df_2016 = pd.read_csv('./deal_data/2016.csv')
df_2017 = pd.read_csv('./deal_data/2017.csv')
df_2018 = pd.read_csv('./deal_data/2018.csv')
df_2019 = pd.read_csv('./deal_data/2019.csv')
# 新增列-年份
df_2015["year"] = str(2015)
df_2016["year"] = str(2016)
df_2017["year"] = str(2017)
df_2018["year"] = str(2018)
df_2019["year"] = str(2019)
# 合并資料
df_all = df_2015.append([df_2016, df_2017, df_2018, df_2019], sort=False)
df_all.drop('Unnamed: 0', axis=1, inplace=True)
df_all.head()
print(df_2015.shape, df_2016.shape, df_2017.shape, df_2018.shape, df_2019.shape)
(158, 10) (157, 10) (155, 10) (156, 11) (156, 11)
df_all.info()
<class 'pandas.core.frame.DataFrame'>
Int64Index: 782 entries, 0 to 155
Data columns (total 10 columns):
region 782 non-null object
rank 782 non-null int64
happiness 782 non-null float64
gdp_per_capita 782 non-null float64
healthy_life_expectancy 782 non-null float64
freedom_to_life_choise 782 non-null float64
corruption_perceptions 781 non-null float64
generosity 782 non-null float64
year 782 non-null object
social_support 312 non-null float64
dtypes: float64(7), int64(1), object(2)
memory usage: 67.2+ KB
資料可視化
2019世界幸福地圖
整體來看,北歐的國家幸福指數較高,如冰島、丹麥、挪威、芬蘭;東非和西非的國家幸福指數較低,如多哥、布隆迪、盧旺達和坦桑尼亞,
代碼展示:
data = dict(type = 'choropleth',
locations = df_2019['region'],
locationmode = 'country names',
colorscale = 'RdYlGn',
z = df_2019['happiness'],
text = df_2019['region'],
colorbar = {'title':'Happiness'})
layout = dict(title = 'Geographical Visualization of Happiness Score in 2019',
geo = dict(showframe = True, projection = {'type': 'azimuthal equal area'}))
choromap3 = go.Figure(data = [data], layout=layout)
plot(choromap3, filename='./html/世界幸福地圖.html')
2019世界幸福國家排行Top10
2019年報告,芬蘭連續兩年被評為“全球最幸福國家”,丹麥、挪威、冰島、荷蘭進入前五名,對比2018年報告,中國從86名下降到93名,
代碼展示:
# 合并資料
rank_top10 = df_2019.head(10)[['rank', 'region', 'happiness']]
last_top10 = df_2019.tail(10)[['rank', 'region', 'happiness']]
rank_concat = pd.concat([rank_top10, last_top10])
# 條形圖
fig = px.bar(rank_concat,
x="region",
y="happiness",
color="region",
title="World's happiest and least happy countries in 2019")
plot(fig, filename='./html/2019世界幸福國家排行Top10和Last10.html')
幸福指數相關性
我們可以得出以下結論:
- 從影響因素相關性熱力圖可以看出,在影響幸福得分的因素中,GDP、社會支持、健康預期壽命呈現高度相關,自由權呈現中度相關,國家的廉政水平呈現低度相關,慷慨程度則呈現極低的相關性;
- GDP與健康預期壽命、社會支持之間存在高度相關,說明GDP高的國家,醫療水平和社會福利較為完善,人民的預期壽命也會越高;
- 健康預期壽命與社會支持之間存在中度相關性,
以下分別觀察各個因素的影響程度,
GDP和幸福得分
人均GDP與幸福得分呈高度線性正相關關系,GDP越高的國家,幸福水平相對越高,
代碼展示:
# 散點圖
fig = px.scatter(df_all, x='gdp_per_capita',
y='happiness',
facet_row='year',
color='year',
trendline='ols'
)
fig.update_layout(height=800, title_text='GDP per capita and Happiness Score')
plot(fig, filename='./html/GDP和幸福得分.html')
健康預期壽命和幸福得分
健康預期壽命與幸福得分呈高度線性正相關關系,健康預期壽命越高的國家,幸福水平相對越高,
代碼展示:
散點圖
fig = px.scatter(df_all, x='healthy_life_expectancy',
y='happiness',
facet_row='year',
color='year',
trendline='ols'
)
fig.update_layout(height=800, title_text='Healthy Life Expecancy and Happiness Score')
plot(fig, filename='./html/健康預期壽命和幸福得分.html')
轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/165080.html
標籤:其他
上一篇:對do{ }while();一直以來的誤解 -----如何理解do{ }while( );陳述句
下一篇:大神幫忙看下
