我正在尝试使用UIMA RUTA 2.6.0匹配一些多字令牌。并且有一些短语彼此部分相等,例如: G。在同一个文件中,我有以下条目:"包括","包括","在此","在"。
我的输入文件中有下一段文字:" 1。 "代理商或员工"包括董事...... "。显然,有一个" 包括"匹配,但如果wordlist中存在其他3个以上的条目,则不会找到匹配项。此外,wordlist中这些条目的排序不依赖于匹配成功:它总是失败。
此问题不仅发生在单个文件中。所以,问题是:我该如何解决?可能是RUTA注释器的一些设置?
答案 0 :(得分:1)
词汇表中的空格可能会导致错过匹配。如果空格不重要,请设置配置参数' dictRemoveWS'为真。
免责声明:我是UIMA Ruta的开发者