目錄
- 4.整數索引
- 5.資料對齊
- 6.函式應用和映射
- 7.排序和命名
- 8.含有重復標簽的軸索引
??上節介紹了一些索引的選擇,下面介紹另外一種選擇資料的方式是使用loc和iloc選擇資料,這兩個分別叫做軸標簽(loc)或整數標簽(iloc),
??軸標簽是通過索引或者列名選擇資料,
??整數標簽是所在位置整數選擇資料,
??loc和iloc還可以帶切片操作,
??例如:

4.整數索引
??在pandas中使用整數索引可能會產生歧義,尤其是當索引或者列名是整數的時候,想要推斷用戶所需要的索引方式是很難的,因此此時的軸標簽(loc)或整數標簽(iloc)就起到了作用了,
5.資料對齊
??pandas的一個重要特性是不同索引的物件之間的算術行為,比如相加時,回傳的結果的索引將是索引對的并集,沒有交集的標簽位置,資料對齊會產生缺失值,
例如:

??將兩個行或列完全不同的DataFrame物件相加,結果將全部為空,
例如:

??可以在有缺失值的時候將缺失值填充為想要的數值,用fill_value方法,
例如:

??可以用rdiv(n)將陣列進行反轉,比如將n/df和df.rdiv(n)等價反轉,
??例如:

6.函式應用和映射
??NumPy的通用函式(逐元素陣列方法)對pandas物件也有效,這里不詳細介紹了,
??還有一個常用的操作是將函式應用到一行或一列的一維陣列上,可以用apply方法來實作這個功能,如果傳遞axis='columns'給apply函式,將會被每行呼叫一次,但是apply構建的一些常用函式可以用DataFrame的方法代替,
??例如:

??如果想要格式化的話,可以在Series中使用map方法,或者在DataFrame中使用applymap方法,
??例如:

7.排序和命名
??對資料按照某種規則進行排序是很重要的操作,比如按行或列索引進行字典型排序,需要使用sort_index方法,以及axis=1,引數,資料會默認升序排列,且所有的缺失值將會被排序至Series的尾部,如果要降序排列的話,需要設定引數ascending=False,
例如:

??如果要根據Series的值進行排序,需要使用sort_values方法,
例如:

??要對DataFrame排序的話,選擇一列或多列作為排序鍵,只要傳遞可選引數by即可,
例如:

8.含有重復標簽的軸索引
??有些Series和DataFrame的索引值可能是不止一個的,用is_unique屬性可以知道它的標簽是否唯一,
例如:

??根據一個標簽索引多個條目會回傳一個序列,而單個條目會回傳標量值,因此的話還要進行進一步篩選,因此盡量不要使用多個重復的索引進行構建pandas的陣列,
轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/180064.html
標籤:Python
上一篇:程式員這生必須掌握的兩種圖形
