我正在使用带有CHARACTER SET UTF8MB4的LOAD DATA将csv文件导入MySQL。这通常最有效,但有时我仍然会收到如下错误:
错误1300(HY000):无效的utf8mb4字符串:“楽天市场をみ”
似乎还有一些汉字不起作用,我也不知道为什么。这些字符是否在utf8mb4之外?该如何处理?
编辑:使用记事本++打开csv时,中文字母后面似乎有一个“看不见的”部分,不确定这是原因还是之前的中文字母:楽天市场をみxE3x82
答案 0 :(得分:0)
数据流中是否有任何内容将该列限制为20个 bytes ? E38292
是を
; E382
似乎是UTF-8截断的字符。我将楽天市場をみxE3x82
解释为6个格式正确的3字节字符,再加上2个字节,因此为20。
我认为问题(可能有20个字节的限制)是在创建 CSV文件之前发生的。