2月15日,數倉軟體巨頭Teradata宣布根據其對中國當前和未來商業環境的慎重評估,將逐步結束在中國的直接運營,后續進入中國公司的關閉程式,
一石激起千層浪,這一訊息,在國內的To B市場引起了廣泛關注,Teradata這家進入中國市場26年,為國內數倉發展帶來重要啟蒙,奠定資料服務人才基礎,被業界稱之為 “數倉人才黃埔軍校”的資料軟體巨頭如今在華落幕,令人感嘆,
近些年來,國產大資料基礎建設百花齊放、發展蓬勃,中國軟體企業在信創產業政策的助攻下,迎來了發展的黃金期,技術和產品能力快速提升,憑借自主可控、創新安全等優勢,已經逐步實作對Teradata等國外主流軟體的成功替換,
其中包括以Hadoop體系為主的CDH、星環,袋鼠云等公司,以國產化資料庫為主的阿里云ADB、華為GussDB、南大通用GBase等資料庫廠商,都紛紛在國產化領域交出了不錯的成績單,
袋鼠云從2016年開始一直深耕于大資料領域,以卓越的技術能力服務3000+客戶,涉及行業解決方案、大資料產品、數倉交建模交付、資料分析等多個領域,在產品和國際同行之間差距不斷縮小的同時,這次Teradata的離開,我們也在思考在這塊市場上袋鼠云可以為客戶提供什么樣的服務,
Teradata無縫遷移至數堆疊-EasyMR
Teradata是一個MPP資料庫,采用share nothing架構,每個節點擁有自己的資源,如CPU、記憶體、磁盤等,每個APM管理自己的資料協同作業,通過BYNET進行網路互聯,在業務場景上,主要應用于資料建模與分析,

該類資料庫SQL兼容性好,支持事物處理、PB級別結構化資料處理速度快,但集群規模調整要求多,增加節點麻煩,單節點緩慢會拖累整體性能,在大資料量的處理任務上,有支持能力嚴重不足的問題,
如果客戶資料量大,存盤和計算成本較高,建議采用Hadoop大資料計算引擎生態,其兼容能力強、擴展性高,基于HDFS進行結構化、非結構化資料存盤,Spark、Flink、Trino多類計算引擎可以滿足不同分析場景,
袋鼠云數堆疊自研的大資料基礎平臺「EasyMR」,是基于Hadoop、Hive、Spark、Flink、HBase、Kafka、Trino等開源組件,構建的彈性計算引擎,提供安全可靠、彈性伸縮、低成本的大資料存盤與計算服務,
于2017年投入商業化使用以來,交付過500+商業化客戶,覆寫金融、政務、制造、教育等多個行業,期間開源ChunJun、Taier、ChengYing等專案,貢獻給開源社區,并于2022年推出EasyMR資料湖版本,在業務場景驅動下,不斷完善技術體系,服務大資料市場,

EasyMR可提供的場景解決方案
· ChunJun資料同步插件:雙向異構資料源、批流一體的資料同步插件,實作業務資料庫向大資料數倉的資料同步,可進行資料整庫同步、批同步、實時同步;
· Spark+Hive:分布式離線資料倉庫建設,進行資料批處理;
· Spark+Hive+Iceberg/Hudi:離線數倉批處理+資料即時更新;
· Kafka+Flink:實時資料倉庫建設;
· Flink+Kafka+Iceberg/Hudi:批流一體化;
· Trino+Hive:OLAP引擎進行億級資料關聯的秒級查詢;
· ClickHouse:OLAP引擎進行寬表的毫秒級查詢;
· HBase:大資料量存盤,高并發快速查詢,
Teradata資料庫遷移至EasyMR,數堆疊可提供的服務
· 歷史資料的整庫遷移;
· Teradata SQL任務的平滑遷移,
袋鼠云大資料基礎平臺「EasyMR」秉承“信創、開源、輕量、專業”的理念提供安全可靠的大資料存盤與計算服務,為企業數字化轉型提供基石,
數堆疊兼容Teradata Vantage資料分析
Teradata Vantage 是一個云計算資料分析平臺,提供資料匯聚與建模、資料服務與分析、機器學習建模等能力,同時預置行業資料模型,如FS-LDM涵蓋銀行、證券、保險的10大主題模型,為客戶提供資料分析服務,
袋鼠云數堆疊提供一站式大資料開發與治理、資料智能分析與洞察、機器與深度學習建模等產品化應用,涵蓋離線開發、實時開發、資料資產、資料服務、指標管理分析、客戶資料洞察等平臺,
提供大資料匯聚、數倉建模、資料治理、資料服務、資料分析的全生命周期能力,并基于Dataops理念構建資料生產流程,加快資料分析鏈路,為企業資料治理提供易用、穩定的資料平臺,達到降本增效的目的,


袋鼠云數堆疊產品矩陣
· 離線開發平臺BatchWorks:一站式大資料批處理平臺,涵蓋全鏈路資料集成、資料開發、任務運維、監控告警等功能,具備靈活的多集群、多引擎對接能力,加速釋放資料價值;
· 實時開發平臺Streamworks:基于Apache Flink 構建的云原生一站式大資料實時平臺,覆寫從實時資料采集到實時資料開發全鏈路流程,提供亞秒級的資料計算處理;
· 資料資產平臺DataAssets:采集全量資產資料,打通資料關系網路,實作資料的標準化和資產化管理,提供全域資料治理能力;
· 資料服務平臺EasyAPI:可視化生成與注冊 API 的資料服務管理平臺,快速構建 OneService 資料共享服務;
· 指標管理分析平臺EasyIndex:通過指標的規范化定義、標準化開發,搭建企業資料指標體系與自助取數服務,實作指標資料的可視、可用、可管;
· 客戶資料洞察平臺DataTag:通過標簽萃取、標簽管理、標簽圈群、群組分析、全面畫像,構建以業務價值為導向的標簽體系和多樣化群組,應用于企業智能化運營與營銷;
· 資料湖平臺EasyLake:提供面向湖倉一體的資料湖管理分析服務,基于統一的元資料抽象構建一致性的資料訪問,提供海量資料的存盤管理和實時分析處理能力,幫助企業快速構建湖倉一體化平臺,
同時,數堆疊基于在金融、政府、制造、教育等各個行業的客戶場景沉淀,產品內置多種行業的資料標準、數倉模型、指標體系、標簽體系,為企業資料建設提供參考與賦能,以及提供全國性、本地化的行業咨詢與資料交付實施服務,下面簡單舉幾個例子:
● 資料標準行業模板

● 指標體系行業模版

● 標簽體系行業模版


不止于此,數堆疊提供全生命周期的資料建模與服務能力,并預置多種行業模型,為企業數字化轉型提供框架與動能,
國產信創,數堆疊在路上
2月22日,***在政治局集體學習會議上強調:“要打好科技儀器設備、作業系統和基礎軟體國產化攻堅戰,提升國產化替代水平和應用規模,爭取早日實作用我國自主的研究平臺、儀器設備來解決重大基礎研究問題,“
近些年來,在國家政策指導下,企業數字化基礎設施逐步國產化,袋鼠云作為國內領先的數字化技術與服務提供商,始終堅持自主研發和國產化路線,高度重視技術創新,公司研發費用逐年提升,研發費用占比高達20%以上,高于行業研發投入的平均水平,
目前,袋鼠云已與麒麟軟體、中科方德、浪潮云、華為云、阿里云、瀚高、龍芯科技、中興通訊等16家國內主流作業系統、服務器、資料庫、芯片廠商完成產品兼容性互認證,這大大提升了袋鼠云旗下產品在國內企業應用環境中的兼容性和擴展性,在軟硬體層面全面兼容X86、ARM、MIPS架構體系,支持市面所有公有云、私有云、混合云廠商平臺,支持CDH、TDH、Libra、Fushionlnsight等存盤引擎,
未來,袋鼠云將繼續秉承“讓資料創造價值”的使命,在大資料道路上持續深耕,為企業的數字化轉型貢獻自己的一份力量,
想了解或咨詢更多有關袋鼠云大資料產品、行業解決方案、客戶案例的朋友,瀏覽袋鼠云官網:https://www.dtstack.com/?src=https://www.cnblogs.com/DTinsight/p/szbky
同時,歡迎對大資料開源專案有興趣的同學加入「袋鼠云開源框架釘釘技術qun」,交流最新開源技術資訊,qun號碼:30537511,專案地址:https://github.com/DTStack
轉載請註明出處,本文鏈接:https://www.uj5u.com/shujuku/545009.html
標籤:大數據
下一篇:reids(2)概述與安裝
