我的資料格式如下:
user1,1001:2|1011:1
user1,1001:1|1011:1
user2,1001:1|1011:1|1012:2
user3,1002:0
第一列是用戶名,第二列是用戶開啟的功能,用|分隔,存在同一欄位中。現在我想求每個用戶的各個功能的開啟數,結果如下:
user1,1001:2 1
user1,1011:1 2
...
請教大家,使用scala如何實作?
uj5u.com熱心網友回復:
這個flatMap reduceByKey就可以了,很簡單轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/62922.html
標籤:Spark
上一篇:桌面云虛擬化和服務器虛擬化區別
下一篇:Server IPC version 9 cannot communicate with client version 4
