Question

我有一些运行了一段时间的python代码，我正在研究如何加快该过程。需要一段时间的代码的主要部分是将数据集上载到SQL Server。最初，我的代码如下所示：

df.to_sql('umf', engine, if_exists = 'replace', dtype = dtype_def, index = False, method = 'multi', chunksize = 50)

这对于所有行都工作正常，没有数据类型问题。今天，我将代码更改为以下代码：

Startup.cs

在阅读了另一个关于可以一次推送的数据量的stackoverflow问题之后，我根据数据量选择了块大小。但是没有其他改变。然后发生问题，我收到一条错误消息，提示无法将类似于“ XXX_XX_XXX”的文本值更改为整数。问题是我在pandas和dtype_def中将此列定义为字符串（pandas中的对象，dtype_def中的varchar）。所以我不明白为什么会有问题。有问题的值是表中的第一个值，因此它不太可能试图从较早的值中猜测数据类型。有人知道什么可能导致错误吗？

更改块大小时Python to_sql数据类型问题

0 个答案: