我有 1 年的資料,我想檢查它是否包含每個月每一天的觀察結果。基本上是為了驗證是否已收集所有內容。資料集包含日、月和年列。我的想法是繪制這個圖,看看是否有幾個月的所有日子。我已經嘗試了以下
fig, ax = plt.subplots()
ax.plot(earth2019['month'], earth2019['day'])
plt.show()
但圖表并沒有真正證實我想知道的,
我的問題是如何驗證我的資料包含所有觀察結果?它應該對每個月的每一天都有一些觀察,我基本上想知道是否已在該資料集中收集了所有資料。有什么方法可以使用 Python 代碼進行檢查嗎?
uj5u.com熱心網友回復:
沒有樣本,這很困難,但您可以嘗試:
ref19 = pd.date_range('2019', '2020', closed='left', freq='D')
dti19 = pd.to_datetime(earth2019.assign(year=2019)[['year', 'month', 'day']])
out = ref19.difference(dti19) # missing dates here
示例輸出:
>>> out
DatetimeIndex(['2019-02-20', '2019-04-02', '2019-04-13', '2019-04-26',
'2019-05-08', '2019-07-19', '2019-09-21', '2019-10-09',
'2019-10-11', '2019-12-22'],
dtype='datetime64[ns]', freq=None)
uj5u.com熱心網友回復:
1.資料集包含日、月、年列
- 檢查它是否包含每個月每一天的觀察結果。
3.驗證是否已全部收集。
df.Yr_Mo_Dy.head()
df.Yr_Mo_Dy.value_counts()
df.Yr_Mo_Dy.isnull().sum()
轉載請註明出處,本文鏈接:https://www.uj5u.com/caozuo/360270.html
下一篇:如何按組和條件用值填充NA
