在我们公司,有许多项目都包含几个信息,例如:源代码,项目信息,错误报告或电子邮件。信息不在中心位置,因此如果您想在过去的项目中搜索已解决的问题,则必须自己搜索。
现在的想法是建立一个可以搜索的项目档案。我们希望使用Apache Solr创建一个Web应用程序,您可以使用它搜索多个信息。
在这种情况下,索引pdf,word或java文件不是问题。问题是,从不同系统收集所有文件的最佳解决方案是什么。这些文档存在于MS Sharepoint,Atlassian Confluence,Jira,SVN或Git等系统中。
从不同系统导出所有信息以将其收集到中心位置的最佳策略是什么,其中索引可以很容易地完成,也可以自动完成。