UIMA ruta - 为什么不起作用?

时间:2016-12-20 14:39:56

标签: uima ruta

对于文本

level 110 KwH

我有规则

W{REGEXP("level")} NUM{-> MARK(energy_consumption)} W{REGEXP("KwH")}

但它没有用。

带有规则

的文字level 110 KH
 W{REGEXP("level")} NUM{-> MARK(energy_consumption)} W{REGEXP("KH")}  

的工作原理。为什么不适用第一条规则?

1 个答案:

答案 0 :(得分:0)

规则不匹配,因为“KwH”不是一个W注释,而是两个W注释(实际上是CW)。 KH只有一个W注释(实际为CAP)。 REGEXP条件匹配匹配注释的覆盖文本(即“Kw”),因此条件/正则表达式永远不会被实现。

您可能想要考虑使用ruta播种器或一些字典查找之外的标记器,或者结合两个CW注释的一些规则。 Ruta提供的初始注释只是一个起点,但没有真正的标记。

免责声明:我是UIMA Ruta的开发者