我要求文档管理系统使用语义搜索来处理pdf,word,xls,ppt。
我开始研究弹性搜索,然后偶然发现Apache JacKrabbit
,然后发现OpenKM
和Hippo
。虽然Jackrabbit中存在像版本控制这样的核心功能,但我需要一些关于如何解决这个问题的建议。
我需要帮助来解决以下问题:
elasticsearch
和elasticsearch
附件插件,还是将Jackrabbit
与MySQL后端一起使用,并使用Elasticsearch对文档编制索引。 任何指针都将非常感激。这最终需要App集成。
更新逻辑上,使用ElasticSearch
进行搜索是有意义的。但我认为我不能将其用作主要数据源。
Apache JackRabbit
与MySQL
的最佳选择是什么? OpenKM
中构建,这是一个更好的选择吗?
答案 0 :(得分:0)
你想要达到什么目标?您是否希望管理文档的可用性,是否管理文档中的内容? ES或任何搜索引擎通常不是主要数据源。
我无法通过OpenKM向您提供任何建议(无论是赞成还是反对)。 Hippo是否匹配取决于您需要了解更多信息的情况。