如何使用刀具概念-UIMA RUTA

时间:2017-02-01 05:48:23

标签: uima ruta

如何在RUTA中使用刀具概念。我已经阅读了文档,但我不清楚。任何人都可以简要解释一下。

1 个答案:

答案 0 :(得分:0)

RutaCutter是一个简单的分析引擎,用于修改CAS中的文档文本。好吧,无法修改文档文本,因此会创建一个存储修改的新视图。有三个配置参数:输入视图的名称,例如_InitialView(您的文本),输出视图的名称,例如cutted(将存储结果的位置),以及完整的类型名称。只有该类型注释所覆盖的文本才会存储在输出视图中。所有其他文本范围将被剪切'。其余文本中的注释偏移将被更新。

这是一个代码示例:

// setup
JCas jcas = JCasFactory.createJCas();
AnalysisEngine cutter = AnalysisEngineFactory.createEngine(RutaCutter.class, RutaCutter.PARAM_KEEP, TruePositive.class.getName());
jcas.setDocumentText("Some text.");
Ruta.apply(jcas.getCas(), "SW{-> TruePositive};");
cutter.process(jcas);

// testing
Collection<TruePositive> select = JCasUtil.select(jcas, TruePositive.class);
Assert.assertEquals(1, select.size());
TruePositive truePositive = select.iterator().next();
Assert.assertEquals(5, truePositive.getBegin());

JCas cuttedView = jcas.getView("cutted");
Assert.assertEquals("text", cuttedView.getDocumentText());
select = JCasUtil.select(cuttedView, TruePositive.class);
Assert.assertEquals(1, select.size());
truePositive = select.iterator().next();
Assert.assertEquals(0, truePositive.getBegin());

jcas.release();
cutter.destroy();

免责声明:我是UIMA Ruta的开发者