我想在法语文档中匹配地名。我尝试使用MARKFAST,但我面临着重音灵敏度的问题。假设我的places.txt
文件包含“Uzès
”。我的RUTA规则如下:
PACKAGE my.example;
DECLARE PlaceName;
WORDLIST PlaceNamesList = "places.txt";
Document{ -> MARKFAST(PlaceName, PlaceNamesList, true)};
该规则正确匹配文本uzès中的Uzès,甚至UZÈS,但 UZES 或 > Uzes ,这是我期望在我的文本中找到的形式。
实现这一目标的正确解决方案是什么?我是否必须生成所有地名的非重音版本? (这并没有完全解决我的问题,我也希望文本中的重音有所不同,例如Uzés)。其他RUTA资源(字表,MTWL)在重音上的表现是否不同?