HBase稳定且可以投入生产吗?

时间:2009-06-20 18:08:51

标签: hadoop hbase

对于在自己的群集上部署了HBase的人,您觉得它对于生产使用来说足够稳定吗?你遇到了哪些类型的麻烦或问题?

我确实看到许多公司在生产中列为使用HBase(http://wiki.apache.org/hadoop/Hbase/PoweredBy),但我很好奇是否需要进行大量的维护,修补和火灾以保持HBase群集的正常运行

1 个答案:

答案 0 :(得分:10)

HBase即将达到HBase-0.20的重要里程碑。有一个阿尔法,很快就会成为一名RC。它已经有了非常重要的性能改进。据报道,StumbleUpon正在为HBase的主干版本提供现场服务,没有其他缓存层。所以我说它绝对可以用于生产。

Ryum Rawson(StumbleUpon)最近在nosql会议上发表了nice talk,其中大部分是关于它在过去6个月中走了多远。如果你不想看整件事,有幻灯片。除了性能改进之外,另一个主要的补充是它现在与zookeeper集成,因此主人不再是单点故障了。

由于文件格式的限制,HBase过去常常因内存小问题而出现小单元格大小。使用新的自定义文件格式也解决了这个问题,这也提高了性能。

我已经用HBase进行了大约一年的实验,我已经准备好用生产服务来信任0.20了,我不太喜欢旧版本。我在实验时建议至少使用4或5个节点的集群。

我无法评论关注生产集群的情况,因为我们只是从生产集群开始。一个有帮助的方面是邮件列表非常活跃,并且irc一直在使用,所以至少有一个非常强大的社区帮助。