如果有人对选择HBase作为OpenTSDB的数据存储引擎有所了解,我真的很感激吗?
还考虑了其他选择,例如Whisper(Graphite front-end + Carbon persistence)?
如果HBase这样的面向列的数据库如何成为时间序列数据的更好选择?
答案 0 :(得分:55)
我之所以选择HBase是因为比例。 Whisper很像RRD,它是一个固定大小的数据库,它必须销毁数据才能在其空间限制内工作。 HBase提供以下属性,使其非常适合大规模时间序列数据库:
HBase是面向列的事实并不是一个重要因素,因为它是一个真正可扩展的大型排序键值系统。
所有基于RRD和RRD的工具都无法满足能够准确存储数十亿和数十亿数据点永远非常便宜的规模要求(每个数据点只有几个字节的实际磁盘空间。)