請教版上大牛
目前我司由于業務保障的需要,計劃部署兩個hadoop集群,一個是資料集群,用于存放所有資料以及提供impala查詢,另一個是計算集群,計劃將所有計算的內容都遷移到該集群,部署spark。
使用方式是spark運行時分批從資料集群中獲取本次批次需要的資料,然后再計算集群上進行運算,運算結果寫到計算集群的hbase中
請問該方法是否可行,另外是否有版友已經采用該部署方案
還望不吝賜教!!!
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/25795.html
標籤:Spark
