在Spark1.6中,默認是采用Sort Shuffle,如使用reduceByKey會生成shuffle檔案,
比如執行wordcount陳述句
sc.textFile("README.md").flatMap(l => l.split(" ")).map(w=>(w,1)).reduceByKey(_ + _).collect
他沒生成檔案,在tmp下只生成了一些檔案夾,檔案夾里面都是空的,是為什么呢?
我也參考了這個網站http://jingpin.jikexueyuan.com/article/13115.html,他是有生成的。
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/75894.html
標籤:Spark
