IndriUI Index Builder无法构建

时间:2019-02-10 04:06:23

标签: information-retrieval lemur indri

我无法获得IndriUI索引构建器来构建索引。它说“正在构建...”,然后将在不构建索引的情况下永久运行。

下图显示了我正在使用的设置和文件。

IndriUI Settings

数据文件夹包含使用以下格式的文件:

<DOC>
<DOCNO> AP880212-0001 </DOCNO>
<FILEID>AP-NR-02-12-88 2344EST</FILEID>
<FIRST>u i AM-Vietnam-Amnesty     02-12 0398</FIRST>
<SECOND>AM-Vietnam-Amnesty,0411</SECOND>
<HEAD>Reports Former Saigon Officials Released from Re-education Camp</HEAD>
<DATELINE>BANGKOK, Thailand (AP) </DATELINE>
<TEXT>
</TEXT>
</DOC>

我相信这是trectext格式,所以这就是我选择的格式。我将文件名过滤器和收集字段留为空白。我使用的停用词文件是一个txt文件,每行都有一个不同的词。我选择了porter作为词干算法。

当我单击“构建索引”时,UI会挂断并说“正在构建...”,并且不会继续进行或构建索引。

UI hung up building index

有什么想法可能是我的问题吗?

0 个答案:

没有答案