資料清洗的方法之空值的處理
isnull 判斷是否為空值,notnull判斷不是空值
data = pd.read_excel(r'人事終表 (1).xlsx')
print(data.isnull()) #isnull判斷元素是否為空值,如果是就回傳True,不是就回傳Fasle
print(data.notnull().sum()) #判斷元素不是空值的方法,
print(data['績效'].notnull().sum()) #整個表中不是空值的數量
fillna查詢到空值后,對空值的操作
#處理空值的方法
#查找空值,并且將空值填充為對應的值
data.fillna({'應發數': 0,'部門':'實習','績效':0,'發放時間':'2020-07工資'},inplace=True) #
dropna 洗掉空值的方法
#subset傳入的是串列,
# axis表示洗掉的行或者列,how表示洗掉的方式是與(all)(勸為空再刪)還是或(any)(有空值就刪)
# thresh=6 表死非空值數量<6,則洗掉
#subset=['姓名','應發數','績效',]表示洗掉的時候,可以根據指定的列中的缺失情況進行判斷
data.dropna(axis=0,how='any',subset=['姓名','應發數','績效',],thresh=6 ,inplace=True)
轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/245221.html
標籤:python
