我已经通过Map-Reduce在hbase表中插入了大约1500万行和32列。
# Key-valued data e.g.
company= ibm ! employee= sw ...
# In hbase it's look like
row =1 column = f1: company time stamp=1123344456 value =ibm ....
虽然我解雇了查询
(scan 'sample_names', {COLUMNS=>"f1:company", FILTER=>SingleColumnValueFilter.new(Bytes.toBytes('f1'), Bytes.toBytes('company'), CompareFilter::CompareOp.valueOf('EQUAL'), SubstringComparator.new("ibm")) })
获取数据需要大约 360.09 秒。 有没有办法提高此查询的性能?我们可以通过二级索引减少查询时间吗?如果是,请建议如何为特定列限定符添加索引。