在分布式环境中构建倒排索引

时间:2014-01-29 13:02:32

标签: elasticsearch hbase information-retrieval

如果必须从头开始构建分布式倒排索引,您会使用哪些工具/库/平台? elasticseach(我需要部分TF与日期约束)只是部分做我需要它,并考虑使用hbase构建一个倒排索引,但想知道是否有一些更理智的选择(我不适合所有内存,并将最初看进入缓存)。

1 个答案:

答案 0 :(得分:1)

您的要求对我来说仍然很模糊,因此一些额外的细节将有助于提供更好的答案。

如果您需要支持分面和模糊术语匹配,Solr Cloud可能是一个不错的选择。 Solr Cloud只是Solr的分布式配置。设置比弹性搜索更乏味,但仍然是一个非常强大和流行的工具。

如果您还没有使用HBase,我不确定我是否建议仅为了创建索引而引入它。

如果我更好地理解您的用例和当前环境,可能会给您一个更好的答案。