您使用了哪些语言,框架和技术来实现文档搜索?

时间:2010-05-04 14:00:05

标签: ruby-on-rails document-management ecm

我是一家新公司,我们的目标之一是为我们的团队和客户实施文档搜索门户。我有点担心,如果我们在云中使用Salesforce等外部服务提供商或其他一些ECM,将来会有很多集成工作。从客户端的角度来看,这些文档也将与我们的结构化内容存在于同一个存储桶中(存储在数据库中,而不是MS Word文档中)。

如果您已实施文档搜索,您使用了哪些语言,框架和技术?你有失败的故事吗?使用开箱即用的东西我没有问题,但我认为我们控制文档和访问它们的API非常重要。如果我们完全自定义,我想使用Rails。

2 个答案:

答案 0 :(得分:2)

根据您的许可需求Lucene(LGPL)和Xapian(GPL),两者都是优秀,成熟,快速的搜索引擎API,可以绑定很多语言。我使用它们都非常成功。

答案 1 :(得分:1)

Lucene可能是最安全的选择,因为它被广泛使用并且非常好。

受益于Lucene的最简单方法可能是Alfresco,安装起来很轻松,默认情况下使用Lucene。这意味着您只需要安装Alfresco,将文档放入存储库,然后使用功能强大的Web搜索界面搜索文档。

如果您需要以编程方式进行搜索,我的建议是使用Alfresco'CMIS界面,该界面允许您以REST方式进行搜索。 JCR API也可用。