将先前带注释的文档导入到IBM Knowledge Studio

时间:2018-11-16 07:26:23

标签: watson-discovery watson-knowledge-studio

我正在做一些有关构建用于实体提取的自定义模型的研究。为此,我使用了一些公共数据集,并希望了解它在IBM Knowledge Studio中的表现。但是我发现很难找到一种方法来将公共数据集(已经被注释)加载到Knowledge Studio。

有文档说,以前带注释的文档可以导入,但是没有指定格式 https://console.bluemix.net/docs/services/watson-knowledge-studio/create-project.html#create-project

文档还说,它可以来自UIMA分析引擎,我找不到任何显示文件格式的好例子

有人可以帮忙吗?

2 个答案:

答案 0 :(得分:1)

Watson Knowledge Studio可以处理从Watson Explorer Content Analytics,Content Analytics Studio或Apache UIMA导出的XMI文件。您可以在下面的文档中找到一些信息。

https://console.bluemix.net/docs/services/watson-knowledge-studio/preannotation.html#preannotation

答案 1 :(得分:0)

希望这对其他人有帮助。

当您尝试将现有带注释的数据导入到Knowledge Studio中时,输入格式没有明确的文档。

我们通过手动注释来自Knowledge Studio的几个文件并导出此数据来进行变通。我们对导出的数据进行了分析,并编写了自定义程序,这些程序会将现有带注释的文本转换为Knowledge Studio接受的格式。

然后将这些数据导入回Knowledge Studio