k如果是String的話,hadoop可以做到把相同的字串合并成
(a,1),(a,2),(a,3),(a,4) -> (a,(1,2,3,4))
像現在,我的k如果是個物件,hadoop能按照我定義的equals進行合并嗎?
就想這樣((a1,b1,c1),1),((a1,b1,c1),2),((a1,b1,c1),3) -> ((a1,b1,c1),(1,2,3))
待處理資料集:

目前的錯誤結果:

其實想要的結果是類似這樣的:
tom yuwen 264
tom shuxue 300
tom yingyu 400
lucy yuwen 456
lucy shuxue 456
lucy yingyu 566
......................
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/85887.html
標籤:Spark
上一篇:CART回歸樹的最優切分問題。
