請教大家一個問題,很頭疼:
一個很大的表,假定叫t表;其中有360億條記錄,大概占用3.6T的硬碟空間;
對該t表插入資料的方式非常簡單,最普通的插入資料的方式;
對該t表讀取資料的方式只有一種非常簡單的方式,類似于 select ... from t where a = .. and b = ..,讀取的并發量不大;
也就是:對t表的使用非常簡單;只是資料量非常大;占用硬碟非常大;
現在想使用hbase存盤、讀取t表的資料;由于沒有hbase、hadoop、zokeeper的任何專案經驗,由于現在需要估算硬體情況,想請教大家一下:
1,需要幾個計算機?每個計算機的作用是什么(比如zookeeper使用幾個計算機、hadoop使用幾個計算機、hbase使用幾個計算機等)?每個計算機的CPU/記憶體/硬碟各是多少?
2,如果購買云主機,哪個公司的比較便宜、穩定?
uj5u.com熱心網友回復:
請教大家;希望得到指教啊;uj5u.com熱心網友回復:
建議直接購買云HBase資料庫(阿里云:https://cn.aliyun.com/product/hbase其他廠商自行比價)不需要關心zk,hadoop,hbase集群細節,也比你直接買ECS再搭建要便宜省心建議采用2主5從 主(2核4G)從(4核8G 2T+硬碟)(阿里云約7萬+一年)
實際可用容量為從節點數 * 單盤容量 / 2 即 5T
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/169901.html
標籤:分布式計算/Hadoop
