文件管理系统建议书

时间:2009-10-24 12:12:47

标签: search full-text-search reporting document-management

我有一个应用程序,每月生成大约10000个打印页面。每个报告(大约2000 /月)在简单网络上以PDF格式存档 文件共享。 我正在寻找符合以下要求的文件管理系统:

  • 观察存档文件夹并定期或在检测到更改时更新索引
  • 提供一个Intranet网页,用户可以根据文件名,时间跨度和其他相关文件属性搜索文档。
  • 全文搜索
  • 可以处理大量/大幅增长的档案

要明确的是,我在这里寻找预先构建的解决方案,接受商业产品。

5 个答案:

答案 0 :(得分:2)

听起来Microsoft Search Server 2008 Express会是一个很好的候选人。免费安装几分钟。

答案 1 :(得分:1)

我可以建议你谷歌文档。 AFAIK它可以满足您的所有要求。

答案 2 :(得分:1)

这是一个非常模糊的问题,我不太清楚如何回应。

看起来您想要一种方法来索引所有文件,并确保信息在数据库中保持最新。我可以建议您查看一些搜索服务器,如:

Sphinx

Solr

这些都需要一些设置,但它们可以满足您的所有要求:可以轻松设置它们以查看文件夹并使您的索引保持最新,它们提供了很好的全文搜索,如果您设置了它们,可以通过Intranet网页访问它们用于搜索数据库的页面,它们用于大量操作,因此大型存档不应成为问题。

如果您正在寻找预先构建的解决方案,我不确定该提及什么。

答案 3 :(得分:1)

Plone可以很好地满足您的需求。它具有用于索引PDF内容的插件,您可以自定义元数据。此外,它还具有内置搜索功能的精彩网页界面。最好的部分是它免费且易于使用,如果您的需求增长,您可以支付费用。

我唯一的建议(乍一看)是您将内容存储在文件系统中,而不是存储在Zope OO数据库中。您应该只将元数据和索引数据存储在数据库中。这是在文档管理世界中存储大量内容的一种非常常见的方式。

希望有所帮助!

Tom Purl

答案 4 :(得分:0)

正如汤姆所说,Plone对你描述的内容做了什么。它构建了全文搜索,它依赖于命令行程序pdfotext,以便pdf位于路径中。您可能对我感兴趣的有几个扩展程序:

(抱歉,由于stackoverflows新用户策略而缺少链接)