如題,目前的使用場景是,已知某城市所有的訂單資料,欄位有:日期、ID、姓名、銷售額等,想利用時間和ID對資料進行聚合后,對聚合后的資料使用銷售額進行二次分組,分組的條件是每10單一個區間,最后的到的應該是每個區間的人員人數;
目前可以通過sum groupby等初級函式進行第一次的資料聚合,想問下二次資料分組時應該怎么操作
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/129606.html
標籤:分布式計算/Hadoop
上一篇:先電云計算
下一篇:flume啟動問題不輸出日志警告
