我必须将MySql DB的字符集从Latin1转换为UTF-8。我为此目的经历了很多文章。
许多文章建议使用encapsulation
,即以latin1编码转储MySql DB,将字符集从latin1替换为UTF-8,并通过Emp
加载字符集UTF-8。
另一个建议是首先将每个字符/文本相关列转换为二进制格式,然后将字符集设置为UTF-8,将其转换为正确的字符/文本类型。
但我想知道如何在迁移后测试数据库?有没有办法找到存储在列中的原始数据的编码,因为我读到可能有机会看到除了列的默认结尾之外的不同编码的数据?
提前感谢。
答案 0 :(得分:0)
This解释了如何SELECT HEX(col)...
查看表格中的内容。然后它列举了它所代表的内容,如果它是UTF-8:西欧的Hex C3yy
;东欧和中东Dxyy
;等
如果您有一些不遵循该模式的8位编码,那么让我们看一下十六进制,以及它应该显示的内容;应该可以推断出编码(latin1,cp1251等)。