python資料分析學習(4)pandas基本功能二-有解無憂

4.整數索引
5.資料對齊
6.函式應用和映射
7.排序和命名
8.含有重復標簽的軸索引

??上節介紹了一些索引的選擇，下面介紹另外一種選擇資料的方式是使用loc和iloc選擇資料，這兩個分別叫做軸標簽(loc)或整數標簽(iloc)，

??軸標簽是通過索引或者列名選擇資料，

??整數標簽是所在位置整數選擇資料，

??loc和iloc還可以帶切片操作，

??例如：

4.整數索引

??在pandas中使用整數索引可能會產生歧義，尤其是當索引或者列名是整數的時候，想要推斷用戶所需要的索引方式是很難的，因此此時的軸標簽(loc)或整數標簽(iloc)就起到了作用了，

5.資料對齊

??pandas的一個重要特性是不同索引的物件之間的算術行為，比如相加時，回傳的結果的索引將是索引對的并集，沒有交集的標簽位置，資料對齊會產生缺失值，

例如：

??將兩個行或列完全不同的DataFrame物件相加，結果將全部為空，

例如：

??可以在有缺失值的時候將缺失值填充為想要的數值，用fill_value方法，

例如：

??可以用rdiv(n)將陣列進行反轉，比如將n/df和df.rdiv(n)等價反轉，

??例如：

6.函式應用和映射

??NumPy的通用函式（逐元素陣列方法）對pandas物件也有效，這里不詳細介紹了，

??還有一個常用的操作是將函式應用到一行或一列的一維陣列上，可以用apply方法來實作這個功能，如果傳遞axis='columns'給apply函式，將會被每行呼叫一次，但是apply構建的一些常用函式可以用DataFrame的方法代替，

??例如：

??如果想要格式化的話，可以在Series中使用map方法，或者在DataFrame中使用applymap方法，

??例如：

7.排序和命名

??對資料按照某種規則進行排序是很重要的操作，比如按行或列索引進行字典型排序，需要使用sort_index方法，以及axis=1，引數，資料會默認升序排列，且所有的缺失值將會被排序至Series的尾部，如果要降序排列的話，需要設定引數ascending=False，

例如：

??如果要根據Series的值進行排序，需要使用sort_values方法，

例如：

??要對DataFrame排序的話，選擇一列或多列作為排序鍵，只要傳遞可選引數by即可，

例如：

8.含有重復標簽的軸索引

??有些Series和DataFrame的索引值可能是不止一個的，用is_unique屬性可以知道它的標簽是否唯一，

例如：

??根據一個標簽索引多個條目會回傳一個序列，而單個條目會回傳標量值,因此的話還要進行進一步篩選，因此盡量不要使用多個重復的索引進行構建pandas的陣列，

轉載請註明出處，本文鏈接：https://www.uj5u.com/houduan/180064.html

標籤：Python

上一篇：程式員這生必須掌握的兩種圖形

下一篇：機器學習之資料探索——資料特征分析（對比分析與統計量分析）