Kaggle中國五城市六年PM2.5資料挖掘
資料來源于kaggle平臺,本文對中國五城市(北京、上海、成都、廣州、沈陽)六年PM2.5資料,進行分析,為了更加直觀,我采用倒敘的方式,先展示成果,再展示資料預處理部分,
文章目錄
- Kaggle中國五城市六年PM2.5資料挖掘
- 3. 資料可視化
- 3.1 PM2.5平均分布情況
- 3.2 時間關系
- 3.2.1 各季節變化情況
- 3.2.2 逐年、季度、月、日變化趨勢
- 3.3 風速的關系
- 3.3.1 PM2.5與各城市風速關系
- 3.3.2 北京PM2.5與風速關系圖
- 3.3.3 除了北京外地區
- 3.4 降水量的關系
- 3.4.1 上海小時降水量
- 3.4.2 累計降水量
- 3.5 溫度關系
- 3.6 相對濕度關系
- 3.7 大氣壓強關系
- 3.8 溫度差關系
- 1. Excel資料預處理
- 1.1 資料探索
- 1.2 資料預處理
- 2. Python合并多個作業表
3. 資料可視化
3.1 PM2.5平均分布情況

北京空氣質量最差,廣州和上海空氣質量最好,成都因地處四川盆地,工業污染難以被風吹散,空氣質量較其它南方城市較差,
3.2 時間關系
3.2.1 各季節變化情況

五個城市連續六年PM2.5大小在一年四季的分布,廣州和上海的空氣質量比較適宜
3.2.2 逐年、季度、月、日變化趨勢

- 可以看到,PM2.5總體是逐年下降的
- 觀察每天各個時段的PM2.5分布更有意義可以看到各此視下午2點的PM2.5平均值最低
3.3 風速的關系
3.3.1 PM2.5與各城市風速關系

PM2.5與風速的關系,點擊查看單個城市的情況,風速越大,PM2.5越低,
3.3.2 北京PM2.5與風速關系圖

PM2.5與風速的關系,僅顯示北京,刮大風總是會刮西北風,
3.3.3 除了北京外地區

可以看出成都的刮風是非常小的,廣州次之
3.4 降水量的關系
PM2.5大小與降水量的關系(默認只顯示上海),
3.4.1 上海小時降水量
降水量越大的時候,PM2.5越低,
可以看到,2013-9-13日的降水量特別大,上海發生了大暴雨

3.4.2 累計降水量
PM2.5大小與累計降水量的關系,累計降水量越大,PM2.5越低,
3.5 溫度關系

由于北京的散點圖掩蓋了其他城市,所以我們用篩選器取出了北京,可以看到,成都是比較熱的,上海溫差較大,沈陽最冷
3.6 相對濕度關系
PM2.5大小與相對濕度的關系(默認不顯示北京廣州),當相對濕度較高時,成都、上海、沈陽資料都出現了斷續,并且大致符合:相對濕度越高、PM2.5的平均值越高的分布情況
- 原因解釋:

3.7 大氣壓強關系
感覺沒有太大關系
3.8 溫度差關系
露點溫度指空氣在水汽含量和氣bai壓都不改變的條件下,冷卻到飽和時的溫度,
形象地說,就是空氣中的水蒸氣變為露珠時候的溫度叫露點溫度,露點溫度本是個溫度值,可為什么用它來表示濕度呢?這是因為,當空氣中水汽已達到飽和時,氣溫與露點溫度相同;當水汽未達到飽和時,氣溫一定高于露點溫度,所以露點與氣溫的差值可以表示空氣中的水汽距離飽和的程度,氣溫降到露點以下是水汽凝結的必要條件

1. Excel資料預處理
首先要對原始資料進行資料處理,主要時替換操作,Excel的vlookup函式就夠了,當然也可以利用pandas中的映射關系來做,就有點大材小用了,
1.1 資料探索
資料欄位

欄位含義
- No: row number 行號
- year: year of data in this row 該行中資料的年份
- month: month of data in this row 該行中資料的月份
- day: day of data in this row 該行中資料的日期
- hour: hour of data in this row 該行中的小時資料
- season: season of data in this row 此行中的資料季節
- PM: PM2.5 concentration (ug/m^3) PM2.5濃度(ug / m ^ 3)
- DEWP: Dew Point (Celsius Degree) 露點(攝氏溫度)
- TEMP: Temperature (Celsius Degree) 溫度(攝氏溫度)
- HUMI: Humidity (%) 濕度(%)
- PRES: Pressure (hPa) 壓力(hPa)
- cbwd: Combined wind direction 組合風向
- Iws: Cumulated wind speed (m/s) 累積風速(m / s)
- precipitation: hourly precipitation (mm) 每小時降水量(毫米)
- Iprec: Cumulated precipitation (mm) 累積降水量(毫米)
資料結構

資料展示
![[外鏈圖片轉存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-1dxJtiF7-3012356376991)(C:\Users\Administrator\AppData\Roaming\Typora\typora-user-images\3012353015277.png)]](https://img.uj5u.com/2021/02/05/2220740516424918.png)
1.2 資料預處理
- 季節替換

- 風向替換

- PM2.5資料處理

- 時間轉換

處理完5個EXCEL表格資料后,就要合并多個作業表,Python比較在行
2. Python合并多個作業表
# -*- coding:utf-8 -*-
# @Author : https://blog.csdn.net/qq_45176548
# @Time : 2021/2/4 0:25
import pandas as pd
import os
os.chdir(r"E:\Python\五省PM2.5")
path = "./archive/"
dfs,index = [],0
for i in os.listdir(path):
dfs.append(pd.read_csv(os.path.join(path,i)))
print(f"正在合并{index+1}作業表")
index += 1
df = pd.concat(dfs)
df.to_csv("./archive/北上廣成沈五城市六年PM2.5資料匯總.csv",index=False)
推薦閱讀
1.Tableau資料分析-Chapter01條形圖、堆積圖、直方圖
2.Tableau資料分析-Chapter02資料預處理、折線圖、餅圖
3.Tableau資料分析-Chapter03基本表、樹狀圖、氣泡圖、詞云
4.Tableau資料分析-Chapter04標靶圖、甘特圖、瀑布圖
5.Tableau資料分析-Chapter05資料集合并、符號地圖
6. Tableau資料分析-Chapter06填充地圖、多維地圖、混合地圖
7. Tableau資料分析-Chapter07多邊形地圖和背景地圖
8. Tableau資料分析-Chapter08資料分層、資料分組、資料集
到這里就結束了,如果對你有幫助,歡迎點贊關注,你的點贊對我很重要
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/256877.html
標籤:AI
上一篇:STM32:重定向 prinft 和 getchar 函式,但是使用程序串口出現問題
下一篇:一只前端程式媛的絮絮叨叨
