应用错误收集

Lucene使用Map / Reduce进行索引和搜索

时间：2011-01-25 12:06:15

标签： java search indexing lucene hadoop

可能重复：
instant searching in petabyte of data…

如何在Lucene索引和搜索中使用HADOOP的Map / Reduce ?????

1 个答案:

答案 0 :(得分：2)

我能找到的最接近的是Katta：

Katta是在许多商用硬件服务器上运行的分布式应用程序，与Hadoop MapReduce，Hadoop DFS，HBase，Bigtable或Hypertable非常相似。

（...）

Katta支持其lucene实施的分布式评分 - 这是因为我们不希望术语分布在所有分片上完全平衡。

在Katta中完成的每个搜索查询最终都是两次网络往返：首先我们从所有节点获得查询的文档频率，并在第二次旅行时将此值和搜索查询传递给所有节点。请注意，我们还提供了一种简单的计数方法，它只计算与查询匹配的文档，但在一次网络往返中进行计数。