将传统汉字与utf 8混合物分开

时间:2011-12-30 15:46:31

标签: c++ c utf-8

我正在用C / C ++编写一个程序,它接受用户的输入。输入是一个utf-8字符串,可能会混合英文和中文以及一些标点符号。

我的程序必须从英文字符中分离出这些汉字。

如您所知,中文字符占用2个字节,英文字符仅占1个字节。我不能迭代char数组来查找是否存在任何英文字符。知道如何解决这个问题吗?

1 个答案:

答案 0 :(得分:0)

获取ICU4C并使用它按字符迭代。