Lucene使用Map / Reduce进行索引和搜索

时间:2011-01-25 12:06:15

标签: java search indexing lucene hadoop

  

可能重复:
  instant searching in petabyte of data…

如何在Lucene索引和搜索中使用HADOOP的Map / Reduce ?????

1 个答案:

答案 0 :(得分:2)

我能找到的最接近的是Katta

  

Katta是在许多商用硬件服务器上运行的分布式应用程序,与Hadoop MapReduce,Hadoop DFS,HBase,Bigtable或Hypertable非常相似。

     

(...)

     

Katta支持其lucene实施的分布式评分 - 这是因为我们不希望术语分布在所有分片上完全平衡。

     

在Katta中完成的每个搜索查询最终都是两次网络往返:首先我们从所有节点获得查询的文档频率,并在第二次旅行时将此值和搜索查询传递给所有节点。请注意,我们还提供了一种简单的计数方法,它只计算与查询匹配的文档,但在一次网络往返中进行计数。