是否有可能以不重音的方式匹配单词列表?

时间:2016-11-29 13:52:35

标签: uima ruta

我想在法语文档中匹配地名。我尝试使用MARKFAST,但我面临着重音灵敏度的问题。假设我的places.txt文件包含“Uzès”。我的RUTA规则如下:

PACKAGE my.example;
DECLARE PlaceName;
WORDLIST PlaceNamesList = "places.txt";

Document{ -> MARKFAST(PlaceName, PlaceNamesList, true)};

该规则正确匹配文本uzès中的Uzès,甚至UZÈS,但 UZES > Uzes ,这是我期望在我的文本中找到的形式。

实现这一目标的正确解决方案是什么?我是否必须生成所有地名的非重音版本? (这并没有完全解决我的问题,我也希望文本中的重音有所不同,例如Uzés)。其他RUTA资源(字表,MTWL)在重音上的表现是否不同?

0 个答案:

没有答案