需要:开源C / C ++正则表达式库,用于执行unicode

时间:2011-02-23 05:10:45

标签: c unicode pcre flex-lexer

我正在寻找一个良好的开源C / C ++正则表达式库,它具有完整的Unicode支持。

我在库可能获得ASCII,UTF-8或UTF-16的环境中使用它。如果它获得UTF-16,它可能有也可能没有必要的引用字符(FF FE)或(FE FF)。

我环顾四周,除了PCRE之外似乎没有其他选择。

我的第二个问题是我目前正在使用flex来构建一些巨大的正则表达式。理想情况下,我会有一个类似flex的词法表达式生成器,它也可以处理Unicode。

有什么建议吗?

2 个答案:

答案 0 :(得分:9)

您考虑过ICU吗?

它已成熟regular expression support

答案 1 :(得分:0)

我相信Boost SpiritBoost Regex都至少有一定程度的Unicode支持。