Lemur Toolkit教程,安装和vs indri

时间:2013-08-04 03:02:48

标签: information-retrieval

我是IR的新手,我想知道使用狐猴或者indri是否更好。狐猴似乎有更多的功能,虽然indri似乎更受欢迎...

以及如何开始,我似乎无法找到任何好的基础教程......我需要知道如何安装和启动一个简单的项目

2 个答案:

答案 0 :(得分:3)

Lemur是一组用于试验搜索的工具。 Indri是Lemur附带的搜索索引。所以使用Indri。

有很好的介绍here

我从来没有找到关于如何安装它的好教程,但是,并没有那么难。

  1. 下载并安装源
  2. 创建索引
  3. 查询索引
  4. 安装源代码后,它将安装一个名为:buildindex的可执行文件。要使用构建索引,您需要创建XML参数文件。这些文件的文档是here。您可以使用相同的参数文件进行索引构建和搜索。 This page列出了索引构建所需的部分。本答案顶部列出的教程在幻灯片16和18上有示例参数文件。

答案 1 :(得分:0)

如果要将其用于索引和查询,可以使用作为Lemur项目一部分的indri。 indri安装文件夹(从here下载并安装正确的版本后,本身有很多源代码。

例如,您可以在以下位置找到java的所有源代码: installationfolder \ Indri \ Indri 5.6 \ src \ swig \ src \ java \ lemurproject \ indri

在java中有一个用于索引构建的示例应用程序: installationfolder \ Indri \ Indri 5.6 \ src \ swig \ src \ java \ IndexUI.jar,

和一个用于检索过程: installationfolder \ Indri \ Indri 5.6 \ src \ swig \ src \ java \ RetUI.jar