我有這樣的資料。
state sex salary
Jordan CA m 100
lebron NY m 200
有4列,但是第一列沒有列名。其他3列是state, sex, salary`。 我如何用上述資料初始化一個資料框架?
我嘗試了以下方法。
import pandas as pd
data = [['JORDAN','CA','m',100] 。['lebron','NY','m',200] ]
df = pd.DataFrame(data, columns = [','state','sex','Age'] )
當我做df.columns時,我看到
Index([', 'state', 'sex', 'Age'], dtype='object')/code>
但是我期望看到Index(['state', 'sex', 'Age'], dtype='object')當我做df.columns
所以我想知道我怎樣才能初始化資料框架,使名字為jordan和lebron的列實際上不是一個列。
uj5u.com熱心網友回復:
data = [['CA'/span>,'m'/span>, 100], ['NY,'m',200] ]
df = pd. DataFrame(data,columns= ['state','sex', 'Age'], index=['JORDAN', 'LEBRON'])
或者你可以用你現有的資料圖來做,如下所示
import pandas as pd
data = [['JORDAN','CA','m',100] 。['lebron','NY','m',200] ]
df = pd.DataFrame(data, columns = [','state','sex','Age'] )
df.set_index(df[''],inplace=True)
df.drop(columns=[''], inplace=True)
uj5u.com熱心網友回復:
只是想在從csv檔案加載時添加場景,你可以使用index_col來指定哪一列作為索引。
假設資料在一個名為temp.csv的檔案中,如:
,state,sex,sary
Jordan,CA,m,100。
lebron,NY,m,200。
你可以用以下方法讀入資料:
import pandas as pd
df = pd.read_csv("temp.csv"/span>, index_col=0)
然后你可以得到
df.index # Index(['jordan', 'lebron'], dtype='object')
df.columns # Index(['state', 'sex', 'service'], dtype='object')
參考資料:
DataFrame。https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.htmlread_csv: https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html
轉載請註明出處,本文鏈接:https://www.uj5u.com/shujuku/306643.html
標籤:
