使用正则表达式在C语言中以UTF8读取和写入文本文件

时间:2011-11-09 02:26:26

标签: c regex unicode utf-8

我必须编写一段代码作用于文件的简单代码;我的软件必须扫描文件,搜索带有正则表达式的模式(我从来没有在C中使用正则表达式,但一般来说,我知道它们)并且它总是假装在UTF8中进行解码和编码。

该文件也有一个UNIX文件格式,如果使用OR语句或类似文件同时运行多个正则表达式,真的很不错。

1 个答案:

答案 0 :(得分:1)

我使用pcre库在C / C ++中使用正则表达式。最初是因为我们将perl代码移植到C,它是一个支持UTF-8的简单库。 http://www.pcre.org/

当我们必须处理非UTF-8编码时,我们首先使用iconv库转换为UTF-8。 http://www.gnu.org/s/libiconv/