結果是這樣,傳到hdfs是這樣
求如何才能去掉括號,最好能解釋下怎么做,謝謝大佬們
uj5u.com熱心網友回復:
你直接把元組陣列列印出來它自然就是那個樣子了,你自己用 println 的方式列印一下不就完了。uj5u.com熱心網友回復:
可還是沒用,列印后還是有括號,那怎么去除呢uj5u.com熱心網友回復:
可還是沒用,列印后還是有括號,那怎么去除呢
uj5u.com熱心網友回復:
沒用過命令列版本。我這里將 rdd 格式化輸出到 hdfs 的 scala 代碼是這么寫的:rdd3.map(item => {
(NullWritable.get(), new Text(item._1 + ", " + item._2));
}).saveAsHadoopFile[TextOutputFormat[NullWritable, Text]](dir);dir 是輸出的 hdfs 目錄。
uj5u.com熱心網友回復:
不適用額
uj5u.com熱心網友回復:
有大神會么,卡在這幾天了
uj5u.com熱心網友回復:
輸出前map一次不加括號就可以了e.g.
.map(x=>val first = x._1
val second = x._2
val third = x._3
val four = x._4
first+"\t"+second+"\t"+third+"\t"+four
}).saveAsTextFile("hdfs://single:9000//app/data/result")
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/259880.html
標籤:分布式計算/Hadoop
