有没有办法从Apache UIMA检索注释列表而不是使用CAS GUI?

时间:2015-02-18 15:59:47

标签: bioinformatics uima

我目前正在使用Apache UIMA来检索表型术语的出现列表。但是,文档(为什么这么多生物信息学软件API缺乏良好的文档!)似乎只是指向CAS调试器GUI,而不是能够返回注释索引。

http://i.stack.imgur.com/giNoj.png - CAS GUI的图片,我想让它返回左下角的注释索引

就像我说的那样,文档并没有真正回答这个问题(https://uima.apache.org/documentation.html),但通常我希望能够在Annotator类中调用process()方法,并让它返回一旦找到任何和所有出现的注释索引。

对不起,如果这是一个愚蠢的问题并且有一个明显的答案,我到目前为止花了三个小时浏览文档并且没有找到答案,如果有人'尝试以类似的方式将它集成到一个项目中并且可以指向正确的方向,我将非常感激!

1 个答案:

答案 0 :(得分:1)

处理方法改变CAS内的状态。在调用ae.process(cas)或ae.process(jcas)之后,注释存储在CAS中。只需从(J)Cas获取注释索引。

Apache uimaFIT也可能对您很方便,因为它提供了各种各样的" select"访问(J)CAS中的注释的方法,例如:

// CAS version
Type tokenType = CasUtil.getType(cas, "my.Token");
for (AnnotationFS token : CasUtil.select(cas, tokenType)) {
  ...
}

// JCas version
for (Token token : JCasUtil.select(jcas, Token.class)) {
  ...
}

有关此API的更多详细信息,请参阅uimaFIT documentation,特别是管道访问方法部分。

披露:我正在研究Apache uimaFIT。