大家好,本人通過parquet api寫了一個檔案,兩個列,id和content列,其中content列為二進制格式,不可讀,我現在用spark sql讀取該檔案時候,spark版本為1.6版本,采用java撰寫,希望提取該二進制列進行處理,通過spark的Row只能獲取String格式的資料,沒有提供獲取二進制的介面,通過String方式獲取的資料再轉為byte陣列已經不是原來的東西了,請大神賜教,是否有方法取出該列內容,感激不盡。
uj5u.com熱心網友回復:
Did you try:sqlContext.setConf("spark.sql.parquet.binaryAsString","true")
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/67605.html
標籤:Spark
上一篇:win8下vmware虛擬機安裝蘋果系統, 出問題了。。。求 大神指點下。。
下一篇:使用consul配置overlay出現 datastore for scope "global" is not initialized錯誤
