更改块大小时Python to_sql数据类型问题

时间:2020-07-23 14:41:18

标签: python sql-server pandas pandas-to-sql

我有一些运行了一段时间的python代码,我正在研究如何加快该过程。需要一段时间的代码的主要部分是将数据集上载到SQL Server。 最初,我的代码如下所示:

df.to_sql('umf', engine, if_exists = 'replace', dtype = dtype_def, index = False, method = 'multi', chunksize = 50)

这对于所有行都工作正常,没有数据类型问题。 今天,我将代码更改为以下代码:

Startup.cs

在阅读了另一个关于可以一次推送的数据量的stackoverflow问题之后,我根据数据量选择了块大小。但是没有其他改变。 然后发生问题,我收到一条错误消息,提示无法将类似于“ XXX_XX_XXX”的文本值更改为整数。问题是我在pandas和dtype_def中将此列定义为字符串(pandas中的对象,dtype_def中的varchar)。 所以我不明白为什么会有问题。有问题的值是表中的第一个值,因此它不太可能试图从较早的值中猜测数据类型。 有人知道什么可能导致错误吗?

0 个答案:

没有答案