我想用Spark 搭建一個實時的大資料分析處理平臺,用戶前端發請求,根據不同的請求內容,后臺spark 進行相應計算,然后把計算好的結果發送給前端進行展示。
我已經寫好了一個版本是 Spark + Play框架 + scala 寫的,但是只能設定成standalone 模式才能用(local),發揮不了Spark 分布式的優勢。
目前我配置好了一個spark集群,是四臺機器,理論上可以加速不少。但是我在網上查了好多 play 和 spark 集群集成的解決方案,貌似都講的不太清楚。
所以我想知道目前業內基于Spark 的應用是如何構建的,開發框架如何向spark 發送計算請求呢?(我還沒作業。。。)
Git 上目前有幾個開源的, Spark Server 和 Spark Job Server, 這兩個怎么樣呢? 適合我的開發嗎?謝謝。
uj5u.com熱心網友回復:
大概了解了一下Play框架,Play 是一個Full-Stack的Web應用開發框架,使用它可以快速撰寫自己的Web應用,也可以使用它來撰寫RESTful API。與現在非常流行的Spring全家桶相比,Play略顯小眾。我這邊用的是SpringBoot,撰寫RESTful API,前端頁面呼叫這些API即可。
①前端呼叫API,向后端持久化的Spark發送計算請求
②Spark接收請求 ,并完成請求,小資料集結果一般直接通過 .toJSON().collect() 以JSON字串的形式回傳給前端
③前端接收結果,決議JSON,展示。
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/35729.html
標籤:Spark
上一篇:u盤
