UIMA RUTA词表匹配问题

时间:2017-05-22 09:49:12

标签: uima ruta word-list

我正在尝试使用UIMA RUTA 2.6.0匹配一些多字令牌。并且有一些短语彼此部分相等,例如: G。在同一个文件中,我有以下条目:"包括","包括","在此","在"。

我的输入文件中有下一段文字:" 1。 "代理商或员工"包括董事...... "。显然,有一个" 包括"匹配,但如果wordlist中存在其他3个以上的条目,则不会找到匹配项。此外,wordlist中这些条目的排序不依赖于匹配成功:它总是失败。

此问题不仅发生在单个文件中。所以,问题是:我该如何解决?可能是RUTA注释器的一些设置?

1 个答案:

答案 0 :(得分:1)

词汇表中的空格可能会导致错过匹配。如果空格不重要,请设置配置参数' dictRemoveWS'为真。

免责声明:我是UIMA Ruta的开发者