什么是Impala
用來處理存盤在Hadoop集群中大量資料的大規模并行處理的sql查詢引擎,它是由C++和Java撰寫的開源軟體,它提供了訪問Hadoop中分布式檔案系統中的資料的最快的方法,
Impalade優點
1.使用Impala,與其他SQL引擎(如Hive)相比,用戶可以使用SQL查詢以更快的方式與HDFS或HBase進行通信,
2.Impala將相同的元資料,SQL語法(Hive SQL),ODBC驅動程式和用戶界面(Hue Beeswax)用作Apache Hive,為面向批量或實時查詢提供熟悉且統一的平臺,
3.減少了使用MapReduce的延遲,這使Impala比Apache Hive快,
Hive,Hbase和Impala
雖然Cloudera Impala使用與Hive相同的查詢語言,元資料和用戶界面,但在某些方面它與Hive和HBase不同, 下表介紹了HBase,Hive和Impala之間的比較分析,
一、
HBase是基于Apache Hadoop的寬列存盤資料庫, 它使用BigTable的概念,
Hive是一個資料倉庫軟體, 使用它,我們可以訪問和管理基于Hadoop的大型分布式資料集,
Impala是一個管理,分析存盤在Hadoop上的資料的工具,
二、
HBase的資料模型是寬列存盤,
Hive遵循關系模型,
Impala遵循關系模型,
三、
HBase是使用Java語言開發的,
Hive是使用Java語言開發的,
Impala是使用C ++開發的,
四、
HBase的資料模型是無模式的,
Hive的資料模型是基于模式的,
Impala的資料模型是基于模式的,
五、
HBase提供Java,RESTful和Thrift API,
Hive提供JDBC,ODBC,Thrift API,
Impala提供JDBC和ODBC API,
六、
HBase支持C,C#,C ++,Groovy,Java PHP,Python和Scala等編程語言,
Hive支持C ++,Java,PHP和Python等編程語言,
Impala支持所有支持JDBC / ODBC的語言,
七、
HBase提供對觸發器的支持,
Hive不提供任何觸發器支持,
Impala不提供對觸發器的任何支持,
轉載請註明出處,本文鏈接:https://www.uj5u.com/shujuku/443495.html
標籤:其他
上一篇:MySQL約束
