最近經常看到spark的新聞。
本人不懂,搜索了很多結果,還是不懂。
求解惑。 在哪些場合使用以及其作用。
PS: openstack juno 也支持spark的特性, 云計算火爆,spark火爆。故關注一下。
困惑
uj5u.com熱心網友回復:
Spark是繼Hadoop之后的新一代大資料分布式處理框架,是一種可擴展的資料分析平臺,它整合了記憶體計算的基元,因此,相對于 Hadoop 的集群存盤方法,它在性能方面更具優勢。Spark 是在 Scala 語言中實作的,并且利用了該語言,為資料處理提供了獨一無二的環境。Spark 是不斷壯大的大資料分析解決方案家族中備受關注的新增成員。它不僅為分布資料集的處理提供一個有效框架,而且以高效的方式(通過簡潔的 Scala 腳本)處理分布資料集。Spark 和 Scala 都處在積極發展階段。不過,由于關鍵 Internet 屬性中采用了它們,兩者似乎都已從受人關注的開源軟體過渡成為基礎 Web 技術。
uj5u.com熱心網友回復:
Spark是繼Hadoop之后的新一代大資料分布式處理框架,是一種可擴展的資料分析平臺,它整合了記憶體計算的基元,因此,相對于 Hadoop 的集群存盤方法,它在性能方面更具優勢。Spark 是在 Scala 語言中實作的,并且利用了該語言,為資料處理提供了獨一無二的環境。uj5u.com熱心網友回復:
Spark是繼Hadoop之后的新一代大資料分布式處理框架,是一種可擴展的資料分析平臺,它整合了記憶體計算的基元,因此,相對于 Hadoop 的集群存盤方法,它在性能方面更具優勢。Spark 是在 Scala 語言中實作的,并且利用了該語言,為資料處理提供了獨一無二的環境。Spark 是不斷壯大的大資料分析解決方案家族中備受關注的新增成員。它不僅為分布資料集的處理提供一個有效框架,而且以高效的方式(通過簡潔的 Scala 腳本)處理分布資料集。Spark 和 Scala 都處在積極發展階段。不過,由于關鍵 Internet 屬性中采用了它們,兩者似乎都已從受人關注的開源軟體過渡成為基礎 Web 技術。
uj5u.com熱心網友回復:
樓上的幾位說的估計又是百度類似的話。。。其實,spark你可以認為就是替代了你以前用的資料庫的趕腳~! 以前你存資料在oracle mysql啊,而現在你要存盤在spark上,那么存spark上是存哪里呢? 就是存在記憶體上。。將關系型資料庫變成了非關系型資料庫的趕腳呢~!
我也是剛學不久,如上就是一個自我理解的趕腳~!不過,大概應該就是這個樣子。
uj5u.com熱心網友回復:
資料處理框架uj5u.com熱心網友回復:
看官網的介紹吧http://spark.apache.org/
uj5u.com熱心網友回復:
集hadoop MR & spark sql 與hive整合,圖計算 GraphX ,機器學習ML,流式計算 spark streaming 為一身的新的資料計算框架轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/91506.html
標籤:Spark
上一篇:現在在EC2 上我開ftp, 在本地cmd 命令列下ftp連接 服務器端,連接成功 ls無法執行?怎么回事?
下一篇:編譯spark原始碼,報錯
