搜索个人知识库文件的索引工具

时间:2009-04-27 05:08:19

标签: search information-retrieval

我有大量基本文本,rtf,html,pdf和chm文件,我将这些文件存储在USB密钥上作为个人知识库。

到目前为止,为了检索信息,我使用了标准的文件搜索工具(windows搜索,grep等)。但是现在由于数据量庞大,强力搜索可能需要几分钟。此外,PDF和CHM也更难搜索。

因此,我正在寻找一种在这种情况下运行良好的文本索引工具。我想避免依赖于RDBMS(即SQL Server,MySQL),因为我将在许多不同的计算机上使用它,并且不希望安装麻烦。便携式工具将是理想的。在某些机器上,我也经常无法访问互联网。

提供简单GUI以允许查询输入和快速访问结果的东西会很棒。

我已经考虑过自己写这篇文章,但是现在我有时间做更多的工作。

2 个答案:

答案 0 :(得分:3)

Google Desktop为您编制索引,Windows Desktop Search(在Windows中)也是如此。 Beagle是一款出色的Linux搜索工具。

答案 1 :(得分:1)

如果您喜欢修补一下,我会使用Lucene - 无论是纯Java版本还是获取https://lucene.apache.org/的副本。
这是一个全文索引器和搜索库,非常适合用于运行usb。