我有一個看起來像這樣的火花資料框
df =
Name Score Section
W 26 A
M 62 A
Q 69 A
Y 86 A
J 16 B
A 83 B
我想創建一個包含單行(得分最高的行)的新資料框,所以它看起來像這樣
dataframe_maximum =
Name Score Section
Y 86 A
我知道我可以使用 groupby 和 agg max 來實作這一點我嘗試過這樣的事情,但我認為我不太正確
dataframe_max = df.groupBy(['Name','Score','Section']).agg(
max('Score')
uj5u.com熱心網友回復:
df.sort("Score",ascending=False).take(1) 雖然,排序是一個廣泛的操作,所以它可能效率不高
轉載請註明出處,本文鏈接:https://www.uj5u.com/qukuanlian/344554.html
