我正在尝试建立一个数据库来存储多种语言的字符串数据,其中包括中文字母。
到目前为止我已经采取的步骤:
我创建了一个使用utf8mb4字符集和utf8mb4_unicode_ci归类的架构。
我创建了一个表,其中包含CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;在CREATE语句的末尾。
我正在尝试使用LOAD语句中指定的CHARACTER SET utf8mb4从CSV文件中加载数据输入文件。
但是,我收到错误代码:1366。错误的字符串值:行43630的'company_name'列的'\ xCE \ x09DIS'。
答案 0 :(得分:0)
它是否成功解析了43629行?然后吱吱作响?实际上可能是文件中的垃圾。
您知道该公司名称应该是什么?其余各行怎么说?
您还有另一个例子吗?删除该行,然后再次运行LOAD
。
CE
可以由任何1字节的字符集解释,但不一定以有意义的方式解释。
09
实际上是所有字符集中的“制表符”字符;在公司名称中使用标签是合理的吗?