如何判断表中的数据是否有不正确的编码?

时间:2009-01-09 16:22:25

标签: mysql character-encoding

我有几个表设置为latin1字符集,但我怀疑是错误插入了一些实际使用utf8编码的值。

MySQL使这变得更加复杂,因为它会根据您的连接设置静默转换所有内容。

如何测试我的假设,即MySQL中的latin1列中有一些utf8编码的字节?

1 个答案:

答案 0 :(得分:2)

如果找到与以下位模式匹配的2个字节的字符串:

110xxxxx 10xxxxxx

很可能这些都是utf-8字符。它们可能是2个连续的非ascii latin-1字符(如'Ä'或不可打印的字符),但这不太可能。