文件存储/搜索

时间:2012-08-02 15:38:38

标签: c# pdf full-text-indexing

我希望你能指出我正确的技术方向。我是一个小型软件开发团队的成员,该团队在c#开发和SQL数据库方面具有良好的技能。

我们的任务是编写文档存储应用程序。此应用程序将收到PDF格式的扫描文档。我们需要存储文档并为操作员提供搜索存储文档的能力。此搜索需要包括搜索PDF内文本的功能。

例如,如果我们有一个包含大量关于动物的PDF的数据库,我们需要操作员通过关键字“马”进行搜索,并获得所有提及“马”一词的文档列表。

我一直在阅读NoSQL数据库和Lucene.Net等库。但我现在投入了大量时间,但仍不清楚我应该使用哪些技术。有没有人在类似的事情上有任何经验或对我应该走的方向有所了解?

0 个答案:

没有答案