应用错误收集

ICU中断规则的前瞻性

时间：2012-09-12 12:51:04

标签： regex tokenize icu

我有一个符合各种表情符号的中断规则，但它也会产生一些不必要的匹配，例如＆＃39;（Be＆＃39;匹配为＆＃39;（贝尔维尤，华盛顿州）＆＃39; ;

我希望通过添加负前瞻来改善它，例如如果笑脸以字母或数字结尾，则不应在其后面出现任何字母或数字。

我是通过在中断规则的末尾添加一个负前瞻子句（当然是在其数字标记之前）来实现的，但是解析失败了。

以下是我尝试的简化规则： [\：] [ - ] [（）]（？！[\ w \ d]）{451};

（它不匹配＆＃39;（在我原来的例子中是＆＃39;）

所以问题是：

是否支持休息规则的环顾？如果是，那么正确的语法是什么？
如果不支持他们，实现目标的最佳途径是什么？

0 个答案:

没有答案