我必须编写一段代码作用于文件的简单代码;我的软件必须扫描文件,搜索带有正则表达式的模式(我从来没有在C中使用正则表达式,但一般来说,我知道它们)并且它总是假装在UTF8中进行解码和编码。
该文件也有一个UNIX文件格式,如果使用OR语句或类似文件同时运行多个正则表达式,真的很不错。
答案 0 :(得分:1)
我使用pcre
库在C / C ++中使用正则表达式。最初是因为我们将perl代码移植到C,它是一个支持UTF-8的简单库。 http://www.pcre.org/
当我们必须处理非UTF-8编码时,我们首先使用iconv
库转换为UTF-8。 http://www.gnu.org/s/libiconv/