我们有一个第三方Web应用程序,通过该应用程序我们可以接收文档(PDF)。每个用户都必须根据一些“关键词”来验证与我们公司相关的文档。有些文件甚至可能与我们的行业无关。
示例:审阅者一年可获取超过14万份文档。其中只有43%的文档可以审阅,即6万张文档。通过花费更多的精力,我们可以识别出大约1.5%(900)个与我们相关的文档,以进行下一步分析。
到目前为止,我们尚未尝试任何机器学习步骤。
我们期望一些想法/逻辑/解决方案是最好的方法 这个问题。我们需要简化机器学习过程, 需要查看更多文档。
我们希望AI将文档标记为相关和不相关 根据关键字。
相关文档必须根据以下内容进行排序和优先级排序: 关键字强度。 AI不再关注无关文档,而是 应该建议审稿人阅读重要的文件。
是否有可能与第三方应用程序集成,或者我们是否需要构建自己的应用程序以导入所有文档并执行此过程或任何类似api的方法。
非常感谢您的想法。
谢谢!