代碼:
pdf=[(1, 'a',4,'a', 4. 1,'d'),(2,'b', 3,'b',3. 2,'c'),(3,'c', 2,'c',2. 3,'b'),(1,'d', 1,'d',1. 4,'a')]
df15 = spark. createDataFrame(pdf, ('x'/span>,'y'/span>,'z'/span>, 'a','b','a') )
df15.show(2)
try: df15.select(df15.a).show(2)
except: print(" failed")
df15.列
try: df15.select(df15.columns[3]) .show(2)
except: print(" failed")
df15.withColumnRenamed('a', 'b_id').show( 2)
df15.drop('a'/span>).show(2)
輸出:
|x| y| z| a| b| a| --- --- --- --- --- --- | 1| a| 4| a|4.1| d| 2| b| 3| b|3.2| c| --- --- --- --- --- --- 只顯示頂部2行 失敗 失敗 --- --- --- ---- --- ---- | x| y| z|b_id| b|b_id| --- --- --- ---- --- ---- | 1| a| 4| a|4.1| d| 2| b| 3| b|3.2| c| --- --- --- ---- --- ---- 只顯示頂部2行 | x| y| z| b| | 1| a| 4|4.1| | 2| b| 3|3.2| 只顯示頂部2行如何重命名一個重復的列或對其進行選擇操作?
- 選擇操作在重復的列名上不起作用 。
- 重命名和下拉操作會對兩個重復的列名進行更改 。
uj5u.com熱心網友回復:
你可以定義一個新的列名串列,并一次性重命名資料框架的所有列,然后放棄你想放棄的任何列
new_cols = ['x'/span>,'y'/span>, 'z','b_id','b','b_id_to_drop']
df = df.toDF(*new_cols)
df = df.drop('b_id_to_drop')
轉載請註明出處,本文鏈接:https://www.uj5u.com/qianduan/310737.html
標籤:
