应用错误收集

时间：2010-06-05 13:52:36

标签： full-text-search

我必须跟上结构化文件，其中包含提案请求，政府计划报告，威胁模型和各种类似的事情。正如我所说的那样，它们属于技术 - 法律背景：高度结构化，具有部分编号以及3,4和5级嵌套。全部用英语

我需要一种更有效的方法来找到对我来说很重要的那些段落。所以我想要的是一种本地文档索引/存储库，这将允许我有一些常设查询并轻松找到谈论我的查询的文档中的部分。这是一个例子：

我确信这样的事情存在。我会称之为文档索引，文档理解或结构化搜索。

答案 0 :(得分：0)

看看Lucene：http://lucene.apache.org/和Solr http://lucene.apache.org/solr/，它可以完成您所要求的大部分内容。虽然它们并不是极其轻量级的！

答案 1 :(得分：0)

Opengrok是另一种基于Lucene的轻量级解决方案：http://opengrok.github.io/OpenGrok/

或者，您可以查看http://www.alfresco.com，这不是轻量级的解决方案，但它的设计完全符合您的目的。