UIMA Ruta:不能忽视使用MarkTable的时期

时间:2014-10-29 12:31:59

标签: uima ruta

如果我有一本包含各种首字母缩略词和名称的词典,我希望能够避免为每个" USA"," USA"和&#34提供参赛作品。 ;美国&#34 ;.我毫不费力地忽略了案例,但忽略字符参数似乎并没有全面发挥作用。在适当的import和declare语句之后,我得到如下内容:

文献{ - > MARKTABLE(Acroynm,1,AcronymDict,真,0,", - " 10" expandedForm&#34 = 2)};

它成功忽略了一组1-10个连字符。它不会忽略整个单词中间隔的10个连字符。 (它会忽略a-bc和a - bc但不会忽略a-b-c。)这对连字符来说实际上很好,但是我不能用上面的语句来忽略句点。 (它既不会忽略a.bc也不会忽略a.b.c.)此外,如果我能让它忽略句点,有什么方法可以忽略A.B.C中的句号。而不只是A.BC中的那个?

对这个论点的局限性的任何进一步描述都是有用的。谢谢。

相关的Ruta文档:https://uima.apache.org/d/ruta-current/tools.ruta.book.html#ugr.tools.ruta.language.actions.marktable

0 个答案:

没有答案