在1月9日Cassandra中文社區開年活動開始之前的閑聊時間,活動的四位嘉賓就“HBase和Cassandra的對比”這一話題展開了討論, 總的來說,HBase和Cassandra各有其優勢特性以及比較適合的應用場景,不過相比HBase來說,Cassandra的持續在線、穩定性高、易于上手等優勢讓嘉賓們印象深刻,紛紛給出好評,
劉騰
華為消費者云服務部cassandra資料庫運維負責人,2011年加入華為,先后負責過分布式存盤,分布式快取和分布式訊息佇列的運維作業,2014年開始接觸cassandra,2018年開始全面負責cassandra的運維作業,“華為有在大規模使用Cassandra,也使用了HBase,Cassandra主要用在OLTP場景,HBase主要用在OLAP場景, 相比HBase,Cassandra的優勢很多,比如我認為Cassandra對運維的友好程度整體比HBase要好,可用性也要高, 我也希望Cassandra未來可以把HBase的部分優點吸收過來,比如引入RocksDB、支持對接多種底層存盤型別、支持計算和存盤分離的架構(可對接HDFS等分布式存盤),“
王鋒
奇虎360集團技術總監,存盤與大資料架構平臺負責人,國內較早從事Cassandra相關技術研究和實踐的開發者,360云盤則是國內早期Cassandra落地較為成功的案例,峰值規模1.4萬物理節點,“360從2011年就開始用HBase和Cassandra這兩套系統了,一方面,這兩種資料庫的使用場景不太一樣,HBase更多的是用在網頁庫、離線分析,而Cassandra更多的是滿足在線(always online)需求, 在選擇這兩種資料庫時主要考慮的點是故障恢復時間,HBase本身故障恢復的時間,它在Region Server宕機之后需要重新分配,這個分配的時間是秒級到分鐘級,是比較長的,如果資料規模比較大,很難用HBase滿足100%在線這種業務需求,很多業務在我們這里很難容忍較大的訪問抖動,或者較大的MTTR的時長,對于這類需求我們更傾向于使用Cassandra, 而對于資料規模大且吞吐量大的場景下的離線分析,我們更多地傾向于使用HBase,因為HBase是基于HDFS之上,很多掃描(scan)型別的訪問用HDFS的效率就比較高一些, 另一個方面,是當我們做一些to B的專案時會發現Cassandra很適合中小規模的場景,因為它沒有中心節點,整體架構比較輕量化,這樣在運維管控方面就會有比較大的優勢, 再加上Cassandra持續可用的特點和按需擴容的能力,以及Cassandra 3.0版本中的同城多活的特性,Cassandra訪問可靠性上會比較有優勢, 整體來說,從資料模型和功能方面來看,這兩種資料庫差不太多,但是在不同的應用場景可能會傾向使用不同的資料庫,“
劉軍民
阿里云資料庫產品經理,目前在阿里云負責云Cassandra資料庫的產品規劃相關作業,曾在19年與多位小伙伴共同發起Cassandra中文社區,期望更多的伙伴加入到社區建設,期待Cassandra在中國區可以生機勃勃,大放異彩,“我們在客戶訪談的程序中經常碰到這樣的疑惑:HBase和Cassandra到底怎么選? 因為我是做資料庫產品的,我個人覺得Cassandra有幾個好處:首先它起配是非常靈活的,另外就是它的穩定性,我們訪談的很多用戶都反映過,在使用Cassandra的程序中資料庫很穩定而且維護也很簡單,因為Cassandra的組件較少,不像HBase有一堆組件需要維護, 所以我個人覺得,HBase更像是Hadoop體系下結合比較緊密的一個大資料存盤工具,而Cassandra更像是一個資料庫,一個非常容易運維的寬表資料庫, 另外Cassandra的開發也很簡便,因為Cassandra的CQL對于MySQL用戶來說沒有太高的學習門檻,很多用戶反饋,以前從來沒有用過Cassandra,但是花了幾天時間學習之后就可以上手了,也就是說學習門檻是很低的, 除此之外,還有一點是穩定、易維護,尤其是在一些小規模集群上,我個人覺得Cassandra除了已有的使用場景外,在一些面向未來的場景,比如5G、AIoT、智能制造這些新興的場景,對一些公司(尤其是初創公司)是更友好的,這也是為什么越來越多的開發者愿意選用Cassandra的原因,“
鄧為
現任DataStax領航架構師總監,深耕分布式資料庫系統十余年,曾經參與Amazon RedShift分布式云資料倉庫前身的核心技術研發,七年前加入DataStax,主要負責為財富500強大客戶和戰略合作伙伴提供咨詢服務,對SQL和NoSQL資料庫,以及相關的大資料產品都有比較豐富的實戰經驗,“我來分享一下我在國外看到的情況,我知道HBase在中國是比Cassandra更流行,比如從百度搜索指數這樣的資料中都能看出來,但是在國外,情況恰恰完全相反, 在權威資料庫排行榜DB Engines中,Cassandra的排名比HBase靠前很多,一般Cassandra都在前十以內,HBase一般在二十名開外,和Cassandra一直有十多名的差距, 根據我和客戶的溝通,國外的客戶現在越來越少人會把HBase和Cassandra比較,我認為,其中的一個原因是,HBase的流行其實是跟著Hadoop起來的,在Google Search上也可以看到HBase的流行程度和Hadoop是正相關的, 不過自2015年以來,Hadoop以及MapReduce這些框架逐漸被Spark這種新興起的大資料處理框架替代,所以搭了Hadoop的快車的HBase在國外就逐漸式微了, 另外HBase的設計確實很容易由于某個模塊出現問題或是由于它對Zookeeper的依賴,而造成單點故障的出現,導致資料庫不能百分之百在線, 如果你完全沒有基礎,重頭開始上手學習一個寬表資料庫的話,Cassandra是比HBase要容易上手得多,Cassandra基本上可以說是能拿來就用的資料庫, 如果你是從別的資料庫轉過來,Cassandra的開發者界面是非常友好的,CQL這種查詢語言和大家熟悉的SQL非常相像,但如果你要使用HBase原生的界面,你需要寫代碼才能使用這個資料庫,這會導致HBase上手比較困難,“
轉載請註明出處,本文鏈接:https://www.uj5u.com/shujuku/250590.html
標籤:其他
上一篇:MySQL 正則運算式
下一篇:抖音資料采集Frida教程,Java、Interceptor、NativePointer(Function/Callback)使用方法及示例
