Uima Ruta不一致词

时间:2016-08-24 13:06:49

标签: uima ruta

I taging HyphenizationWord像离线,新列表,VBSE-in..etc使用

(SW|CW|CAP) HYPHEN (SW|CW|CAP) HYPHEN (SW|CW|CAP) {-PARTOF(HyphenizationWord) ->MARK(ThreeHyphenizationWord,1,5)};
(SW|CW|CAP) HYPHEN (SW|CW|CAP)  {-PARTOF(HyphenizationWord),-PARTOF(ThreeHyphenizationWord) ->MARK(HyphenizationWord,1,3),MARK(PreHyphenizationWords,1),MARK(PosHyphenixationWords,3)};

我总是希望标记离线,新列表......等字样。 但是我的剧本在VBSE专栏中错误地发了一些单词LIke..off。

DECLARE ComplexPreWord,ComplexPostWord;
//BLOCK (foreach) HyphenizationWord{}
//{
 STRING PreWord;
STRINGLIST PreWordList;
PreHyphenizationWords{-   >MATCHEDTEXT(PreWord),ADD(PreWordList,PreWord)};
W {INLIST(PreWordList)->ComplexPreWord};

STRING PostWord;
STRINGLIST PostWordList;
PosHyphenixationWords{- >MATCHEDTEXT(PostWord),ADD(PostWordList,PostWord)};
W {INLIST(PostWordList)->ComplexPostWord};
//}

ComplexPreWord ComplexPostWord{->MARK(ComplexWord,1,2)};

有任何方法可以纠正我的问题..

1 个答案:

答案 0 :(得分:2)

我不知道我是否理解你的问题,但也许这就是你想要的:

mvn clean install

脚本以您的规则(重写)开头。然后,HyphenizationWord注释的覆盖文本存储在列表中,但事先删除了破折号和空格。然后,此列表仅用于使用MARKFAST进行字典查找。

免责声明:我是UIMA Ruta的开发者