应用错误收集

使用Apache Lucene进行搜索优化

时间：2014-10-13 07:02:45

标签： java hadoop lucene cloudera

我正在开发一个项目，使用Apache Lucene在Twitter数据上实现大规模索引以进行搜索优化。 Lucene提供反向索引来过滤掉符合指定选择标准的块。

要实现这个项目，我应该怎么做 - 我应该安装Cloudera虚拟机并继续吗？或者我应该在Ubuntu平台上从Apache部署Hadoop吗？

我之所以这样问是因为我无法确认Cloudera是否已经使用Lucene来优化搜索。

请告知。

1 个答案:

答案 0 :(得分：1)

Cloudera为您提供了用于自动安装和集群管理的debian软件包和软件。而已。在Hadoop堆栈中没有关于搜索（和它的优化）的任何内容。所以你可以为你的项目选择香草或cloudera。

对于搜索，您可以使用Elasticsearch。它有integration with hadoop并在内部使用Lucene