标签: c unicode pcre flex-lexer
我正在寻找一个良好的开源C / C ++正则表达式库,它具有完整的Unicode支持。
我在库可能获得ASCII,UTF-8或UTF-16的环境中使用它。如果它获得UTF-16,它可能有也可能没有必要的引用字符(FF FE)或(FE FF)。
我环顾四周,除了PCRE之外似乎没有其他选择。
我的第二个问题是我目前正在使用flex来构建一些巨大的正则表达式。理想情况下,我会有一个类似flex的词法表达式生成器,它也可以处理Unicode。
有什么建议吗?
答案 0 :(得分:9)
您考虑过ICU吗?
它已成熟regular expression support。
答案 1 :(得分:0)
我相信Boost Spirit和Boost Regex都至少有一定程度的Unicode支持。