ICU中断规则的前瞻性

时间:2012-09-12 12:51:04

标签: regex tokenize icu

我有一个符合各种表情符号的中断规则,但它也会产生一些不必要的匹配,例如'(Be'匹配为'(贝尔维尤,华盛顿州)' ;

我希望通过添加负前瞻来改善它,例如如果笑脸以字母或数字结尾,则不应在其后面出现任何字母或数字。

我是通过在中断规则的末尾添加一个负前瞻子句(当然是在其数字标记之前)来实现的,但是解析失败了。

以下是我尝试的简化规则: [\:] [ - ] [()](?![\ w \ d]){451};

(它不匹配'(在我原来的例子中是')

所以问题是:

  1. 是否支持休息规则的环顾?如果是,那么正确的语法是什么?
  2. 如果不支持他们,实现目标的最佳途径是什么?

0 个答案:

没有答案