我正在做一些有关构建用于实体提取的自定义模型的研究。为此,我使用了一些公共数据集,并希望了解它在IBM Knowledge Studio中的表现。但是我发现很难找到一种方法来将公共数据集(已经被注释)加载到Knowledge Studio。
有文档说,以前带注释的文档可以导入,但是没有指定格式 https://console.bluemix.net/docs/services/watson-knowledge-studio/create-project.html#create-project
文档还说,它可以来自UIMA分析引擎,我找不到任何显示文件格式的好例子
有人可以帮忙吗?
答案 0 :(得分:1)
Watson Knowledge Studio可以处理从Watson Explorer Content Analytics,Content Analytics Studio或Apache UIMA导出的XMI文件。您可以在下面的文档中找到一些信息。
https://console.bluemix.net/docs/services/watson-knowledge-studio/preannotation.html#preannotation
答案 1 :(得分:0)
希望这对其他人有帮助。
当您尝试将现有带注释的数据导入到Knowledge Studio中时,输入格式没有明确的文档。
我们通过手动注释来自Knowledge Studio的几个文件并导出此数据来进行变通。我们对导出的数据进行了分析,并编写了自定义程序,这些程序会将现有带注释的文本转换为Knowledge Studio接受的格式。
然后将这些数据导入回Knowledge Studio