我有一个在AWS EMR中运行的Apache Hbase集群。该数据库由一个表组成,表中包含行和列的字符串以及值中的整数。该表很宽,有50,000列和大约75,000行。所有列都在一个列族下。
rowkey col1 col2 col3 ... col50000
rowkey1 0 255 456
rowkey2 .. ...
rowkey3
我要执行的唯一操作是选择此矩阵的子集-选择某些行和列并返回它们。但是,即使选择单行也非常慢-大约需要10秒才能返回。文档和案例研究保证了毫秒级的延迟-我在做什么错了?