主頁 > 資料庫 > 數堆疊V6.0全新產品矩陣發布,資料底座 EasyMR 煥新升級

數堆疊V6.0全新產品矩陣發布,資料底座 EasyMR 煥新升級

2023-04-28 12:09:30 資料庫

4月20日,袋鼠云成功舉行了以“數實融合,韌性生長”為主題的2023春季生長大會,會上,袋鼠云自主研發的一站式大資料基礎軟體——數堆疊V6.0產品矩陣全新發布,對旗下大資料基礎平臺、大資料開發與治理、資料智能分析與洞察三大模塊的全線產品進行全新升級,并重點發布了企業級資料計算與存盤平臺——自研大資料引擎 EasyMR,

今年的集體學習會議上強調:“要打好科技儀器設備、作業系統和基礎軟體國產化攻堅戰,提升國產化替代水平和應用規模,爭取早日實作用我國自主的研究平臺、儀器設備來解決重大基礎研究問題,”

袋鼠云作為國內領先的數字化基礎軟體與應用服務商,自始自終堅持自主創新,專注大資料基礎軟體研發,利用先進技術賦能更多行業客戶數字化轉型,助力發掘和釋放資料資源的潛在價值,

全新發布數堆疊V6.0產品矩陣

袋鼠云產研負責人思樞首先介紹了數堆疊V6.0全新產品矩陣的落地進展以及產品升級方向,通過對多年數字化實踐沉淀的梳理、重構和升級,數堆疊V6.0形成了大資料基礎平臺層+大資料開發與治理層+資料分析與洞察平臺層的全新數字化產品矩陣,以迭代的新組合、新能力、新技術,為數實融合應用注入更強勁的“數堆疊”驅動力,

file

整個矩陣中,大資料基礎平臺是底座,包含全新升級的兩款產品:大資料計算引擎EasyMR 和湖倉一體EasyLake,EasyMR 主要提供 Hadoop、Spark、Flink、HBase、Trino 等一鍵式組件的安裝、運維、部署,EasyLake 則主要提供面向資料湖的統一元資料管理,及資料服務和分析,大資料基礎平臺旨在為各行業的數字化轉型提供隨時可用的強勁動力和堅實基礎,

往上看,中間層大資料開發與治理,它融合了 DataOps 資料理念,包含離線開發BatchWorks、實時開發StreamWorks、資料服務DataAPI、資料資產DataAssets和指標管理DataIndex 五大模塊,以自主可控、安全創新為技術內核,將全域資料資產進行匯聚、加?、治理、服務、分析,為客戶提供安全、穩定、易?的?資料平臺,加速釋放資料價值,賦能數智應用,

最上層的資料智能分析與洞察層,提供客戶資料洞察UserInsight和資料可視化分析EasyBI兩大應用功能,助力企業構建以業務價值為導向的資料分析與應用體系,驅動業務增長,

以下為數堆疊本次重點升級的大資料計算引擎產品 EasyMR,根據思樞演講整理而成,

EasyMR:大資料計算引擎

EasyMR 的豐富功能

EasyMR 內包含 Hadoop、Hive、Spark、Trino、HBase、Kafka 等計算組件,完全兼容 Apache 開源生態,一鍵開啟 LDAP+Kerberos+Ranger 認證權限體系,支持庫/表/行/列級權限控制,提供企業級安全管控,

file

EasyMR 的集群管理包括以下五大功能:

· 主機管理:可以對接x86服務器、ARM 服務器、Kubernetes 集群等主機型別,進行包括批量接入、主機下架、主機監控等在內的主機操作

· 安裝部署:包含自動部署、手動部署、補丁包升/降級、組件回滾等豐富功能

· 集群運維:包含組件啟停、健康檢查、服務日志查看等功能,以及根據客戶業務側的使用情況實作動態擴縮容

· 監控告警:隨著業務的運行,發生主機運行的例外情況,能夠實作自動告警

· 基礎管理:包括用戶管理、操作權限管理、審計日志等功能

EasyMR 的豐富功能能夠幫助企業,更全面、更智能、更安全地運用資料,加速企業數字化轉型,

EasyMR 的核心特性

● 信創國產化

EasyMR 完成了與主流信創生態廠商的適配互認作業,支持統信UOS、龍蜥、麒麟等國產作業系統,鯤鵬920、飛騰等國產芯片,長城擎天CF520、華為公有云等國產服務器的適配,以及大部分國產資料庫、國產中間件的適配,

EasyMR 的更多信創兼容情況請看下圖:

file

● 開源/自主可控

EasyMR 作為袋鼠云自研的大資料基礎平臺,其大資料組件100%基于開源 Hadoop,完全兼容 Apache 開源生態,與開源社區同步迭代,時刻保持技術的領先性,并且 EasyMR 對 Spark、Flink、Trino、Iceberg 等部分組件特性進行優化增強,回饋社區,以開放心態共建 Hadoop 生態,

● 運維托管服務

EasyMR 提供大資料集群監控告警、安全保障、資料質量保障以及平臺運維服務;提供定期巡檢、深度體檢、成本優化以及高階調優服務;以及提供包括大資料集群遷移、集群容災建設、架構設計規劃等在內的實施服務,全鏈路一站式運維托管服務,

● 安全

通過 LDAP+Kerberos+Ranger 這套認證權限體系,對庫/表/行/列級進行權限控制,實作企業級安全管控,

EasyMR 國產化適配:中間件,元資料庫

Hive 的子組件 Hive Metastore,在開源的方案中通過 redis 進行快取加速,而現在可以通過寶蘭德BCS 這樣的國產中間件對 redis 進行國產化替代,

Hive Metastore 本身的元資料資訊在開源方案中存盤在 MySQL 和 OracleSQL 中,現在也可以通過適配國產資料庫,如 TDSQL、OceanBase,對開源資料庫進行替代,基于此,EasyMR 實作真正的國產化,完全自主可控,

file

EasyMR 深知只有實作關鍵技術的自主化、國產化,才能真正實作技術創新,攻克“卡脖子”難題,

EasyMR 對大資料組件的功能增強

袋鼠云作為國內領先的數字化基礎軟體與應用服務商,十分重視強化產品的基礎能力和技術能力,在開源技術的基礎上,EasyMR 對 Spark、Flink、Trino、Iceberg 等多個大資料核心組件進行了功能及性能增強,具體優化見下圖:

file

僅在2022年袋鼠云技術同學就完成了上百次的 commit,為 Hadoop 生態的技術發展貢獻了屬于袋鼠云的力量,

贈人玫瑰手有余香,回饋社區的同時袋鼠云實作了對整個 Hadoop 體系核心代碼的完全自主掌握,對于 EasyMR 大資料平臺遷移、大資料組件維保等做到了100%自主可控,

EasyMR 自主研發能力:技術開源

從2016年數堆疊V1.0發布開始,到如今的數堆疊V6.0,數堆疊已經歷經了七年六個大版本的迭代實踐,隨著對技術能力的不懈探索,數堆疊內部也沉淀了一些優秀的大資料組件,如流批一體的資料同步集成組件ChunJun,DAG分布式任務調度組件Taier、大資料平臺運維組件ChengYing等,這些組件數堆疊已經全部貢獻給了Github,下面是袋鼠云開源的地址,歡迎使用,

Github地址:https://github.com/DTStack

file

技術無界,創新不止,袋鼠云數堆疊技術團隊連續兩年榮獲“年度優秀開源技術團隊”的稱號,ChunJun 也順利晉級“2022 年中國開源創新大賽”決賽,并榮獲“優秀開源專案/社區”獎項,這些鼓勵都源于數堆疊技術團隊出眾的產品技術能力和自主研發能力,

CDP/CDH 平滑遷移到 EasyMR 解決方案

基于國家對于國產信創的政策要求,以及 CDH 停止服務(EoS),用戶沒辦法再獲取售后支持的大背景,各行各業的大資料平臺底座需要進行國產化替代的需求越來越強烈,基于此,數堆疊支持 CDP/CDH 平滑遷移到 EasyMR 的解決方案,大大降低企業遷移成本低,

生產業務不能停,該方案支持雙軌運行,即客戶的原 CDH 集群和信創的 EasyMR 集群可以同時運行,整個遷移程序操作簡單,配置靈活,通過4步即可完成所有的遷移作業,

第一步,進行計算平臺和開發套件的替換,

第二步,進行資料遷移,包括歷史資料和元資料的遷移,在遷移程序中,EasyMR 支持資料檢驗,保證在資料遷移程序中的資料一致,

第三步,執行任務遷移,包括采集任務、資料加工任務、任務依賴關系以及分析引擎,

第四步,業務切割,包含集群的切換,及老服務器下線,新服務器上線等動作切換,最終達到 CDP/CDH 平滑遷移到 EasyMR 的目的,并且實作對客戶側的業務無感知,

EasyMR 積累了大量的遷移成功案例,經驗豐富,可以保障整個遷移程序安全可靠,

Hadoop 平滑升級解決方案

大資料組件每年的版本更新速度比較快,不少企業還停留在 Hadoop2.0 的階段,許多客戶想升級到 Hadoop3.0 版本,體驗新的特性和性能優化,但是客戶的業務在版本更新中又不能停止,這時應該怎么做?

EasyMR 可實作節點的動態替換,將一個節點先升級到 Hadoop3.0 的節點,在這個節點上印證沒有問題之后,再進行剩下節點的逐步替換,這樣就真正實作了 Hadoop 的無感知平滑升級,

file

EasyMR 的實踐應用

在介紹完 EasyMR 的具體功能和特性之后,下文將為大家介紹2個 EasyMR 的經典實踐應用落地,更深地感受 EasyMR 是如何幫助企業更高效、平滑、安全地實作實作國外進口產品的國產化替代,

某全國性股份制商業銀行:CDH 遷移至 EasyMR

某全國性股份制商業銀行,為解決分行資料應用建設效率差等問題,數堆疊幫助該客戶實作了 CDH 平滑遷移至 EasyMR,并且為該客戶建立了“總行統一調度+分行資料協同共享”的資料應用云平臺,

file

EasyMR 使用 Trino 替換 Impala,解決了客戶 Impala 記憶體過度占用導致節點宕機的問題,提升查詢性能,實作了資源動態隔離;并且采用「云平臺」的模式,總行+各個分行是平臺上的單獨租戶,底層存盤、計算資源共享提升資料下發效率,資料權限隔離保證安全,不用再擔心出現分行資料誤洗掉、丟失等安全問題,EasyMR 兼容信創生態體系,平滑遷移至國產化環境,符合金融行業的信創國產化要求,

通過 EasyMR 大資料基礎平臺的建設,該全國性股份制商業銀行實作了成本管理和業務管控的雙效提升,

某支付行業云服務品牌:EasyMR + 數堆疊Saas化

金融行業正逐漸從數字化時代邁向智能化時代,該客戶的需求是將 EasyMR 和數堆疊進行 Saas 化,依托資料中臺產品,賦能客戶,加快走向智能化時代的步伐,

file

面對客戶需求,數堆疊 + EasyMR 與云平臺的網路架構、服務器、云平臺的統一權限管控等各項內容實作全面兼容適配,保證在客戶開通權限資源后,依然能夠保障 EasyMR 的穩定運行,并且數堆疊 + EasyMR 實作了「訂購—自動化部署—一鍵擴縮容」等各類操作,

作為大資料基礎軟體國產化的重要推動者之一,數堆疊還擁有大量成熟大資料解決方案,可以更好地支持各行業智能化、數字化應用建設,

首發數堆疊V6.0產品白皮書

此外,會上還發布了《數堆疊產品白皮書》:從數字技術、產品能力、應用實踐、服務支持四個方面進行深度研判,針對性克服數字化轉型短板,從資料治理、湖倉一體、資料集成、DataOps 等八個方面進行解決方案解讀,重點提升客戶資料管控能力,此外,本白皮書總結了有效的大資料基礎軟體建設經驗,為各行業企業的數字化轉型提供參考和指導,

歡迎大家掃碼進行免費獲取,

file

數堆疊始終堅持自主可控,積極致力于幫助客戶打造國產創新的企業級大資料基礎軟體,幫助客戶夯實資料基座,建立從資料獲取生產到資料消費利用的全生命周期管理體系,使資料“可見、可用、可管”,洞察數字化機遇,明確轉型方向,創造資料新價值,

今后,數堆疊產品也將更加貼合實際場景,用數智化方式解題,踐行“用資料產生價值”的使命,

《數堆疊產品白皮書》:https://www.dtstack.com/resources/1004?src=https://www.cnblogs.com/DTinsight/archive/2023/04/27/szsm

《資料治理行業實踐白皮書》下載地址:https://www.dtstack.com/resources/1001?src=https://www.cnblogs.com/DTinsight/archive/2023/04/27/szsm

想了解或咨詢更多有關袋鼠云大資料產品、行業解決方案、客戶案例的朋友,瀏覽袋鼠云官網:https://www.dtstack.com/?src=https://www.cnblogs.com/DTinsight/archive/2023/04/27/szbky

同時,歡迎對大資料開源專案有興趣的同學加入「袋鼠云開源框架釘釘技術qun」,交流最新開源技術資訊,qun號碼:30537511,專案地址:https://github.com/DTStack

轉載請註明出處,本文鏈接:https://www.uj5u.com/shujuku/551397.html

標籤:其他

上一篇:CloudCanal x OceanBase 資料遷移同步優化

下一篇:返回列表

標籤雲
其他(158251) Python(38107) JavaScript(25396) Java(18003) C(15217) 區塊鏈(8260) C#(7972) AI(7469) 爪哇(7425) MySQL(7152) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5870) 数组(5741) R(5409) Linux(5332) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4564) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2432) ASP.NET(2402) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) 功能(1967) .NET技术(1961) Web開發(1951) HtmlCss(1928) python-3.x(1918) 弹簧靴(1913) C++(1912) xml(1889) PostgreSQL(1874) .NETCore(1855) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • GPU虛擬機創建時間深度優化

    **?桔妹導讀:**GPU虛擬機實體創建速度慢是公有云面臨的普遍問題,由于通常情況下創建虛擬機屬于低頻操作而未引起業界的重視,實際生產中還是存在對GPU實體創建時間有苛刻要求的業務場景。本文將介紹滴滴云在解決該問題時的思路、方法、并展示最終的優化成果。 從公有云服務商那里購買過虛擬主機的資深用戶,一 ......

    uj5u.com 2020-09-10 06:09:13 more
  • 可編程網卡芯片在滴滴云網路的應用實踐

    **?桔妹導讀:**隨著云規模不斷擴大以及業務層面對延遲、帶寬的要求越來越高,采用DPDK 加速網路報文處理的方式在橫向縱向擴展都出現了局限性。可編程芯片成為業界熱點。本文主要講述了可編程網卡芯片在滴滴云網路中的應用實踐,遇到的問題、帶來的收益以及開源社區貢獻。 #1. 資料中心面臨的問題 隨著滴滴 ......

    uj5u.com 2020-09-10 06:10:21 more
  • 滴滴資料通道服務演進之路

    **?桔妹導讀:**滴滴資料通道引擎承載著全公司的資料同步,為下游實時和離線場景提供了必不可少的源資料。隨著任務量的不斷增加,資料通道的整體架構也隨之發生改變。本文介紹了滴滴資料通道的發展歷程,遇到的問題以及今后的規劃。 #1. 背景 資料,對于任何一家互聯網公司來說都是非常重要的資產,公司的大資料 ......

    uj5u.com 2020-09-10 06:11:05 more
  • 滴滴AI Labs斬獲國際機器翻譯大賽中譯英方向世界第三

    **桔妹導讀:**深耕人工智能領域,致力于探索AI讓出行更美好的滴滴AI Labs再次斬獲國際大獎,這次獲獎的專案是什么呢?一起來看看詳細報道吧! 近日,由國際計算語言學協會ACL(The Association for Computational Linguistics)舉辦的世界最具影響力的機器 ......

    uj5u.com 2020-09-10 06:11:29 more
  • MPP (Massively Parallel Processing)大規模并行處理

    1、什么是mpp? MPP (Massively Parallel Processing),即大規模并行處理,在資料庫非共享集群中,每個節點都有獨立的磁盤存盤系統和記憶體系統,業務資料根據資料庫模型和應用特點劃分到各個節點上,每臺資料節點通過專用網路或者商業通用網路互相連接,彼此協同計算,作為整體提供 ......

    uj5u.com 2020-09-10 06:11:41 more
  • 滴滴資料倉庫指標體系建設實踐

    **桔妹導讀:**指標體系是什么?如何使用OSM模型和AARRR模型搭建指標體系?如何統一流程、規范化、工具化管理指標體系?本文會對建設的方法論結合滴滴資料指標體系建設實踐進行解答分析。 #1. 什么是指標體系 ##1.1 指標體系定義 指標體系是將零散單點的具有相互聯系的指標,系統化的組織起來,通 ......

    uj5u.com 2020-09-10 06:12:52 more
  • 單表千萬行資料庫 LIKE 搜索優化手記

    我們經常在資料庫中使用 LIKE 運算子來完成對資料的模糊搜索,LIKE 運算子用于在 WHERE 子句中搜索列中的指定模式。 如果需要查找客戶表中所有姓氏是“張”的資料,可以使用下面的 SQL 陳述句: SELECT * FROM Customer WHERE Name LIKE '張%' 如果需要 ......

    uj5u.com 2020-09-10 06:13:25 more
  • 滴滴Ceph分布式存盤系統優化之鎖優化

    **桔妹導讀:**Ceph是國際知名的開源分布式存盤系統,在工業界和學術界都有著重要的影響。Ceph的架構和演算法設計發表在國際系統領域頂級會議OSDI、SOSP、SC等上。Ceph社區得到Red Hat、SUSE、Intel等大公司的大力支持。Ceph是國際云計算領域應用最廣泛的開源分布式存盤系統, ......

    uj5u.com 2020-09-10 06:14:51 more
  • es~通過ElasticsearchTemplate進行聚合~嵌套聚合

    之前寫過《es~通過ElasticsearchTemplate進行聚合操作》的文章,這一次主要寫一個嵌套的聚合,例如先對sex集合,再對desc聚合,最后再對age求和,共三層嵌套。 Aggregations的部分特性類似于SQL語言中的group by,avg,sum等函式,Aggregation ......

    uj5u.com 2020-09-10 06:14:59 more
  • 爬蟲日志監控 -- Elastc Stack(ELK)部署

    傻瓜式部署,只需替換IP與用戶 導讀: 現ELK四大組件分別為:Elasticsearch(核心)、logstash(處理)、filebeat(采集)、kibana(可視化) 下載均在https://www.elastic.co/cn/downloads/下tar包,各組件版本最好一致,配合fdm會 ......

    uj5u.com 2020-09-10 06:15:05 more
最新发布
  • 數堆疊V6.0全新產品矩陣發布,資料底座 EasyMR 煥新升級

    4月20日,袋鼠云成功舉行了以“數實融合,韌性生長”為主題的2023春季生長大會。會上,袋鼠云自主研發的一站式大資料基礎軟體——數堆疊V6.0產品矩陣全新發布。對旗下大資料基礎平臺、大資料開發與治理、資料智能分析與洞察三大模塊的全線產品進行全新升級,并重點發布了企業級資料計算與存盤平臺——自研大資料引 ......

    uj5u.com 2023-04-28 12:09:30 more
  • CloudCanal x OceanBase 資料遷移同步優化

    簡述 CloudCanal 去年支持 OceanBase 資料遷移同步能力后,隨著使用用戶增多以及問題反饋,近期對該能力進行了一輪較大規模的優化。 本篇文章簡要介紹這些優化點,以及未來該能力的演進方向。 優化點 大幅提升同步性能 CloudCanal 目前使用 OceanBase LogProxy ......

    uj5u.com 2023-04-28 12:09:01 more
  • [20230425]CBO cost與行遷移關系.txt

    [20230425]CBO cost與行遷移關系.txt--//一般現在很少使用analyze table分析表,如果出現大量行遷移是否考慮看看是否考慮cbo cost成本.--//測驗參考鏈接:--//https://richardfoote.wordpress.com/2023/03/21/cb ......

    uj5u.com 2023-04-28 12:08:40 more
  • day07-優惠券秒殺03

    功能03-優惠券秒殺03 4.功能03-優惠券秒殺 4.6Redisson的分布式鎖 Redis分布式鎖—Redisson+RLock可重入鎖實作篇 4.6.1基于setnx實作的分布式鎖問題 我們在4.5自己實作的分布式鎖,主要使用的是redis的setnx命令,它仍存在如下問題: 4.6.2Re ......

    uj5u.com 2023-04-28 12:07:54 more
  • Performance_schema中的主從復制系串列總結

    主從半同步復制是目前用得最多的MySQL復制方案,日常作業中我們一般通過show slave status陳述句查看當前復制程序中狀態資訊,基本上能滿足大多數場景下的需求。Performance_schema中提供了16個關于復制的監控表(包括組復制、過濾復制等,這里我們先不討論),show slav ......

    uj5u.com 2023-04-28 12:02:16 more
  • mysql基礎

    SQL陳述句 SQL陳述句分類 SQL分類: 資料定義語言:簡稱DDL(Data Definition Language),用來定義資料庫物件:資料庫,表,列等。關鍵字:create,alter,drop等 資料操作語言:簡稱DML(Data Manipulation Language),用來對資料庫中 ......

    uj5u.com 2023-04-28 11:55:05 more
  • [20230427]bbed sum apply問題2.txt

    [20230427]bbed sum apply問題2.txt--//使用bbed修改資料塊時,最后總要sum apply改寫校驗和,但是修改redo檔案是一個例外,sum apply不會修改.--//通過例子說明:1.環境:SCOTT@book> @ ver1PORT_STRING VERSION ......

    uj5u.com 2023-04-27 10:49:07 more
  • [20230427]bbed sum apply問題2.txt

    [20230427]bbed sum apply問題2.txt--//使用bbed修改資料塊時,最后總要sum apply改寫校驗和,但是修改redo檔案是一個例外,sum apply不會修改.--//通過例子說明:1.環境:SCOTT@book> @ ver1PORT_STRING VERSION ......

    uj5u.com 2023-04-27 10:47:39 more
  • mysql基礎練習(二)

    -- 創建表 drop table if exists emp; create table emp( empno int, ename varchar(50), job varchar(50), mgr int, hiredate date, sal decimal(7,2), comm decim ......

    uj5u.com 2023-04-27 08:49:18 more
  • MySql中執行計劃如何來的——Optimizer Trace

    當談到MySQL的執行計劃時,會有很多同學想:“我就覺得使用其他的執行方案比EXPLAIN陳述句輸出的方案強,憑什么優化器做的決定與我得不一樣?”。這個問題在MySQL 5.6之前或許自己很難解決,但是現在MySQL5.6及更高的版本中引入了Optimizer Trace。 ......

    uj5u.com 2023-04-27 08:49:13 more