我有一个Hadoop集群(hdfs,yarn,hbase),开发人员抱怨性能问题,因此我试图进行许多优化,但是作为Hbase的初学者,我想知道当前的性能。
我开发了一种快速工具,自1周以来,该工具将10万个并行线程中的10万个产品注入到Phoenix表(该结构与生产表具有相同的结构)中,并绘制图形结果。
我的Hadoop集群由以下组成:
我正在使用Apache Hadoop 2.8.3,Hbase 2.0.0和Phoenix 5.0.0
我的注射器工具的当前结果是(在10个并行线程中插入100k个要约):
最差的喷射时间对应于一个时刻,其中有许多纱线过程正在运行,因此这并不令我感到惊讶。 results graph
我的问题是“简单”:1000次插入/秒的比率好吗?还是我应该还有更多?
谢谢。