如何在使用to_sql创建表时强制使用utf8mb4?

时间:2019-05-29 10:39:52

标签: python mysql pandas sqlalchemy utf8mb4

我正在从Python中的API导入一些数据,将其格式化并使用to_sql将其保存到MySQL数据库中。

results, types, valid = self.process_data(data, [])
        if valid:
            results.to_sql(
                con=self.db.connection,
                name="degreed_" + method,
                if_exists="replace", 
                index=False,
                dtype=types,
            )

在我的连接中,我已将utf8mb4指定为字符集:

self.connection = create_engine(
            'mysql+mysqlconnector://{0}:{1}@{2}/{3}?charset=utf8mb4'.
            format(database_username, database_password, database_ip, database_name))

在我的类型中,我的文本列为:

NVARCHAR(length=500, collation='utf8mb4_bin').

但是,我仍然收到错误消息:

COLLATION 'utf8mb4_bin' is not valid for CHARACTER SET 'utf8' 

在MySQL中,我的character_set_client是utf8mb4,默认表字符集是utf8mb4。为什么设置字符集utf8?

很抱歉,如果我在这里做任何愚蠢的事情,我通常对sqlalchemy和mysql还是陌生的。

1 个答案:

答案 0 :(得分:0)

原来的问题是我使用的是NVARCHAR而不是VARCHAR,因此结果被转换为UTF8。