求各位大神幫忙,現在有個程式,大概思想是:我現在有一串數,每個數都有各自影響生成一串新數,然后對這些新數分別計算出一串資料,最后對第二次生成的所有數排序,根據這些排序把第三次生成的數寫到檔案中,我現在spark流程就是上面說的,請問有什么好的想法可以大大提升速度嗎?
示例:比如,一開始只有一個數:1(可以有多個數),然后這個數生成一串新數:5,2,6,對5,2,6分別進行計算,比如2,生成陣列1.3,4.5;5生成陣列5.5,3.7;6生成陣列2.3,6.7;然后對5,2,6進行排序,把生成的數寫入檔案,結果是:1.3,4.5,5.5,3.7,2.3,6.7
求大神幫忙~~~
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/98750.html
標籤:Spark
