无法在MySQL中存储某些中文字符

时间:2019-10-14 09:27:04

标签: mysql utf-8 utf8mb4

我正在使用带有CHARACTER SET UTF8MB4的LOAD DATA将csv文件导入MySQL。这通常最有效,但有时我仍然会收到如下错误:

  

错误1300(HY000):无效的utf8mb4字符串:“楽天市场をみ”

似乎还有一些汉字不起作用,我也不知道为什么。这些字符是否在utf8mb4之外?该如何处理?

编辑:使用记事本++打开csv时,中文字母后面似乎有一个“看不见的”部分,不确定这是原因还是之前的中文字母:楽天市场をみxE3x82

1 个答案:

答案 0 :(得分:0)

数据流中是否有任何内容将该列限制为20个 bytes E38292E382似乎是UTF-8截断的字符。我将楽天市場をみxE3x82解释为6个格式正确的3字节字符,再加上2个字节,因此为20。

我认为问题(可能有20个字节的限制)是在创建 CSV文件之前发生的。