我正在使用eclipse开发UIMA Ruta,在其中创建了注释器以获取文本,注释器突出显示了所需的文本,但是Ruta创建的输出文件(遵循注释器规则)是XML格式。我想知道如何在单独的文本文件中生成注释器的输出。
我尝试使用Ruta查询获取输出,但是结果显示在新的弹出窗口中,该窗口未保存输出,请参考文档,知道我应该手动保存输出
想要获取仅保存注释器输出的文本文件。
答案 0 :(得分:0)
由于UIMA Ruta是Apache UIMA文本处理框架的一部分,为了单独使用Ruta保存创建的注释,您需要从使用UIMA生成的Ruta输出中获取所需的注释。
可以找到here
,这是UIMA的一个很好的起点。基本上,一旦有了jCas,就可以使用以下命令提取所需的批注:
Collection<YourAnnotationType> annotations = JCasUtil.select(jCas, YourAnnotationType.class);
从这里开始,annotations
(及其功能)可以保存到外部CSV文件。