Pandas對檔案進行排序并將值分組-有解無憂

我正在學習熊貓，但遇到了一些麻煩。我將資料作為 DataFrame 匯入，并希望將 2017 年的人口值分成四個大小相等的組。并統計group4的數量

但是系統列印出來：

---------------------------------------------------------------------------
KeyError                                  Traceback (most recent call last)
<ipython-input-52-05d9f2e7ffc8> in <module>
      2 
      3 df=pd.read_excel('C:/Users/Sam/Desktop/商業分析/Python_Jabbia1e/Chapter 2/jaggia_ba_1e_ch02_Data_Files.xlsx',sheet_name='Population')
----> 4 df=df.sort_values('2017',ascending=True)
      5 df['Group'] = pd.qcut(df['2017'], q = 4, labels = range(1, 5))
      6 splitData = [group for _, group in df.groupby('Group')]

C:\ProgramData\Anaconda3\lib\site-packages\pandas\core\frame.py in sort_values(self, by, axis, ascending, inplace, kind, na_position, ignore_index, key)
   5453 
   5454             by = by[0]
-> 5455             k = self._get_label_or_level_values(by, axis=axis)
   5456 
   5457             # need to rewrap column in Series to apply key function

C:\ProgramData\Anaconda3\lib\site-packages\pandas\core\generic.py in _get_label_or_level_values(self, key, axis)
   1682             values = self.axes[axis].get_level_values(key)._values
   1683         else:
-> 1684             raise KeyError(key)
   1685 
   1686         # Check for duplicates

KeyError: '2017'

它出什么問題了？謝謝~

這是資料框： Pandas 對檔案進行排序并將值分組

我試過了：

df=pd.read_excel('C:/Users/Sam/Desktop/商業分析/Python_Jabbia1e/Chapter 2/jaggia_ba_1e_ch02_Data_Files.xlsx',sheet_name='Population')
df=df.sort_values('2017',ascending=True)
df['Group'] = pd.qcut(df['2017'], q = 4, labels = range(1, 5))
splitData = [group for _, group in df.groupby('Group')]
print('The number of group4 is :',splitData[3].shape[0])

uj5u.com熱心網友回復：

您正在將密鑰插入df.sort_values()為str. 您可以將其作為串列中的元素提供，也可以不提供。

df = df.sort_values(by=['2017'], ascending=True)

要么

df = df.sort_values(by='2017', ascending=True)

這僅在列值與您傳遞的字串完全匹配時才有效。如果它不是字串，或者該字串包含一些空格，它將不起作用。您可以在排序之前洗掉任何尾隨空格，

df.columns = df.columns.str.strip()

如果它不是你應該使用的字串，

df = df.sort_values(by=[2017], ascending=True)

uj5u.com熱心網友回復：

首先，您在第 4 行的排序中有問題，您告訴排序函式查找字串 2017，但它是整數。試試這個然后繼續你的代碼：

df=df.sort_values([2017],ascending=True)

轉載請註明出處，本文鏈接：https://www.uj5u.com/ruanti/456672.html

標籤：Python 熊猫通过...分组

上一篇：如何在沒有KeyError的情況下用df.reindex替換df.loc

下一篇：Pandas：如何顯示包含的開始和結束bin標簽