UIMA ruta注释包含来自特定词列表的单词的固定长度序列

时间:2017-02-15 12:17:32

标签: uima ruta

我有一个WORDTABLE,其中包含表示为字符串(零,一,二,......, n )的数字以及相应的数字作为要素。我试图注释一个固定长度的字符串数字的序列。

例如:

一二三四 - >应注明

一二三四五六 - >不应该注释

到目前为止,我已经完成了

WORDTABLE numbers = "numbers.csv";

DECLARE Annotation number(STRING int_string, STRING digit);
DECLARE Annotation numberSequence;

Document{-> MARKTABLE(number, 1, numbers, "digit" = 2)};
(number number) {-> MARK(numberSequence)};

这匹配包含 n 字符串化数字的序列,我想要的是确定序列的长度,如:

number[4,4] {-> MARK(numberSequence)};

其中包含字符串化数字的句子中的最小和最大标记应该相等,例如,为4。 有可能这样做吗?

1 个答案:

答案 0 :(得分:1)

如果有number类型的正好有四个注释,这是一个用于注释文本位置的示例性规则:

ANY{-PARTOF(number)} @number[4,4] {-> MARK(numberSequence)} ANY{-PARTOF(number)};

免责声明:我是UIMA Ruta的开发者