对于在自己的群集上部署了HBase的人,您觉得它对于生产使用来说足够稳定吗?你遇到了哪些类型的麻烦或问题?
我确实看到许多公司在生产中列为使用HBase(http://wiki.apache.org/hadoop/Hbase/PoweredBy),但我很好奇是否需要进行大量的维护,修补和火灾以保持HBase群集的正常运行
答案 0 :(得分:10)
Ryum Rawson(StumbleUpon)最近在nosql会议上发表了nice talk,其中大部分是关于它在过去6个月中走了多远。如果你不想看整件事,有幻灯片。除了性能改进之外,另一个主要的补充是它现在与zookeeper集成,因此主人不再是单点故障了。
由于文件格式的限制,HBase过去常常因内存小问题而出现小单元格大小。使用新的自定义文件格式也解决了这个问题,这也提高了性能。
我已经用HBase进行了大约一年的实验,我已经准备好用生产服务来信任0.20了,我不太喜欢旧版本。我在实验时建议至少使用4或5个节点的集群。
我无法评论关注生产集群的情况,因为我们只是从生产集群开始。一个有帮助的方面是邮件列表非常活跃,并且irc一直在使用,所以至少有一个非常强大的社区帮助。