如何在Lucene索引和搜索中使用HADOOP的Map / Reduce ?????
答案 0 :(得分:2)
我能找到的最接近的是Katta:
Katta是在许多商用硬件服务器上运行的分布式应用程序,与Hadoop MapReduce,Hadoop DFS,HBase,Bigtable或Hypertable非常相似。
(...)
Katta支持其lucene实施的分布式评分 - 这是因为我们不希望术语分布在所有分片上完全平衡。
在Katta中完成的每个搜索查询最终都是两次网络往返:首先我们从所有节点获得查询的文档频率,并在第二次旅行时将此值和搜索查询传递给所有节点。请注意,我们还提供了一种简单的计数方法,它只计算与查询匹配的文档,但在一次网络往返中进行计数。