如何在RUTA中使用刀具概念。我已经阅读了文档,但我不清楚。任何人都可以简要解释一下。
答案 0 :(得分:0)
RutaCutter是一个简单的分析引擎,用于修改CAS中的文档文本。好吧,无法修改文档文本,因此会创建一个存储修改的新视图。有三个配置参数:输入视图的名称,例如_InitialView
(您的文本),输出视图的名称,例如cutted
(将存储结果的位置),以及完整的类型名称。只有该类型注释所覆盖的文本才会存储在输出视图中。所有其他文本范围将被剪切'。其余文本中的注释偏移将被更新。
这是一个代码示例:
// setup
JCas jcas = JCasFactory.createJCas();
AnalysisEngine cutter = AnalysisEngineFactory.createEngine(RutaCutter.class, RutaCutter.PARAM_KEEP, TruePositive.class.getName());
jcas.setDocumentText("Some text.");
Ruta.apply(jcas.getCas(), "SW{-> TruePositive};");
cutter.process(jcas);
// testing
Collection<TruePositive> select = JCasUtil.select(jcas, TruePositive.class);
Assert.assertEquals(1, select.size());
TruePositive truePositive = select.iterator().next();
Assert.assertEquals(5, truePositive.getBegin());
JCas cuttedView = jcas.getView("cutted");
Assert.assertEquals("text", cuttedView.getDocumentText());
select = JCasUtil.select(cuttedView, TruePositive.class);
Assert.assertEquals(1, select.size());
truePositive = select.iterator().next();
Assert.assertEquals(0, truePositive.getBegin());
jcas.release();
cutter.destroy();
免责声明:我是UIMA Ruta的开发者