我有一個具有多索引的隨機資料框,如下所示:
import numpy as np
from itertools import product
import pandas as pd
c1 = np.arange(3,5,1)
c2 = np.arange(7,9,1)
c3 = np.arange(0,135,45)
df= pd.DataFrame(list(product(c1, c2, c3)), columns=['c1', 'c2','c3'])
df['c4'] = df.index
df = df.set_index(['c1', 'c2','c3'])
當我將資料框保存到 csv 時,我得到一個在 MultiIndex c1、c2、c3 中具有重復值的 csv。我只想讓 c1、c2 的唯一值在 csv 檔案中出現一次,因為它們都是連續出現的。在將它們保存到 csv 之前,如何在 Pandas 中屏蔽這些值?
uj5u.com熱心網友回復:
你可以在寫通知之前屏蔽to_csv這里不需要set_index
df.c2.mask(df.duplicated(['c1','c2']),'',inplace=True)
df.c1.mask(df.duplicated('c1'),'',inplace=True)
df
Out[415]:
c1 c2 c3 c4
0 3 7 0 0
1 45 1
2 90 2
3 8 0 3
4 45 4
5 90 5
6 4 7 0 6
7 45 7
8 90 8
9 8 0 9
10 45 10
11 90 11
轉載請註明出處,本文鏈接:https://www.uj5u.com/qianduan/491345.html
下一篇:Pandas-連接資料框
