我正在linux中导入一个保存为utf8的csv,看起来不错。 mysql db中的表是为utf8设置的,因此是连接排序规则。我正在使用“CSV使用LOAD DATA”导入,字符集为UTF8。然而人物正在改变。例如∙变成了â™。什么可能导致这种情况?
答案 0 :(得分:0)
可能是您的MySQL数据库使用utf8
编码。这是因为MySQL中的utf8
不等同于一般的UTF-8编码,但仅支持UNICODE字符的子集。例如,您不能编码像∙
这样的数学字符,子弹算子。
如果您希望完全支持所有UNICODE字符,则应尝试使用utf8mb4
编码,因为它显示在MySQL manual中:
utf8
,Unicode字符集的UTF-8编码,每个字符使用一到三个字节。
utf8mb4
,Unicode字符集的UTF-8编码,每个字符使用一到四个字节。
您还可以在manual中看到有关UNICODE支持的完整讨论。