删除或编码非UTF-8字符

时间:2011-10-09 19:06:24

标签: php utf-8

是否有从字符串中删除所有非UTF-8字符的功能?

1 个答案:

答案 0 :(得分:10)

如果您的UTF-8字符串可能包含无效字符,则可以使用iconv删除这些字符。这应该有效:

$text = iconv("utf-8", "utf-8//ignore", $text);

使用任意占位符使它们可见有点困难 - 我想不出任何简单的方法,不能遍历每个字节并查看它是否是有效字符。 Wikipedia article提供了有关如何执行此操作的详细信息。