我们使用Hive(v.1.2.1)在accumulo(v.1.7.1)表上用“sql like”读取。
我们可以在蜂巢或某处配置什么特殊设置以获得我们的性能或稳定性?
如果我们以这种方式使用配置单元是否有任何意义,例如尝试一些配置单元索引或任何设置,如“hive.auto.convert.join”,或者它以不同的方式工作,并且在这些情况下不会真正影响?
谢谢!
答案 0 :(得分:0)
强制性:我写了(大部分)AccumuloStorageHandler,但我绝不是Hive专家。
您可能能够找到的最大收获是您可以以这样的方式构建查询,即可以修剪行空间(通过:rowid-mapped列中的WHERE子句中的语句)。据我所知,没有多少(任何?)查询优化被推送到Accumulo本身。
根据您的工作量,您可以使用Hive生成自己的"索引表"在Accumulo。如果您可以创建一个自定义表,其中包含您要在Accumulo行中存储的主动查询的列,则查询应该运行得更快。