我有一個 CSV 資料,我需要根據某個欄位(年份)將其加載到 HDFS 目錄中。我打算使用Java。我已經看過使用 BufferedReader 但是我在實作它時遇到了麻煩。這是用于此任務的最佳方法還是有更好的方法?
uj5u.com熱心網友回復:
使用 Spark 將 CSV 讀入資料幀。
partitionBy("year")在寫入 HDFS 期間使用,它將在路徑下year=為每個唯一值創建子檔案夾。
轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/360155.html
上一篇:ClouderaHadoopImpala-提取上次重繪日期
下一篇:NoSuchMethodError:org.apache.hadoop.conf.Configuration.getPassword
