我正在运行python脚本以在表中插入记录。我正在从电子表格中读取包含特殊字符单元格的数据。
在我的脚本中,我先运行以下命令,然后再执行以下命令:
SET NAMES utf8mb4;
SET CHARACTER SET utf8mb4;
SET character_set_connection=utf8mb4;
SET collation_connection = utf8mb4_unicode_ci;
这是我的表结构:
CREATE TABLE `staging` (
`id` int(11) NOT NULL AUTO_INCREMENT,
`d_date` date NOT NULL,
`m_date` date NOT NULL,
`market` varchar(10) COLLATE utf8mb4_unicode_ci NOT NULL DEFAULT 'US',
`cola` varchar(100) COLLATE utf8mb4_unicode_ci NOT NULL,
`colb` varchar(255) COLLATE utf8mb4_unicode_ci NOT NULL
) ENGINE=InnoDB AUTO_INCREMENT=265 DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_unicode_ci;
表编码:UTF8MB4 表排序规则:UTF8MB4_UNICODE_CI
环境变量:
类似于“%collation%”的显示变量;
collation_connection latin1_swedish_ci
collation_database utf8mb4_unicode_ci
collation_server utf8mb4_unicode_ci
类似于“%char%”的显示变量;
character_set_client latin1
character_set_connection latin1
character_set_database utf8mb4
character_set_filesystem binary
character_set_results latin1
character_set_server utf8mb4
character_set_system utf8
character_sets_dir /usr/local/mysql-5.7.20-macos10.12-x86_64/share/charsets/
查询:
insert into staging (d_date, m_date, market, cola, colb )
values ('2019-07-18', '2019-07-01', 'US', 'ARCA', 'Sodius\xa0Consumer Auto');
错误:
_mysql_exceptions.OperationalError: (1366, "Incorrect string value: '\\xA0Consu...' for column 'colb' at row 1")
预期结果是应将行插入数据库。
答案 0 :(得分:0)
这表示客户端中的编码为UTF-8:SET NAMES utf8mb4;
这表示客户端中的编码为latin1:\xa0
。
这表示cola
将被编码为UTF-8,而不管客户端有什么cola varchar(100) COLLATE utf8mb4_unicode_ci NOT NULL
。
这就是说您做了SET NAMES latin1
:
character_set_client latin1
character_set_connection latin1
character_set_results latin1
如果您确实想要\xA0
(硬空间),那么客户端中的整个文本也必须是latin1,并且您必须说出SET NAMES latin1
(或...-有几种方法为此)。
如果您不在乎使用哪种类型的空间,请使用一个简单的空间。
如果客户端的其余部分正在使用UTF-8,并且您想要一个“不间断空格”,请使用\xc2a0
(UTF-8编码)。