Question

我使用以下代码读取CSV文件，替换空值并将结果写入另一个文件：

with open('result.csv', 'a') as f:
    for chunk in pd.read_csv('personaldata.csv', chunksize=10000):
        chunk.fillna('N/A', inplace=True)
        chunk.to_csv(f, sep=',', index=False)

此代码工作正常并用N/A替换空值，但问题是所有在开头都有零（0）的列都会删除这些值。

我的CSV文件如下所示：

id,CompanyNumber,oldAppointmentType
1, 00000006,     "Current Secretary"
5, 00000058,     "Current Secretary"

当我在新文件中写入结果时，列CompanyNumber如下所示：

CompanyNumber
       6
      58

我认为这可能是因为我正在使用chunksize所以，我将文件分成几个文件并尝试没有chunksize，但结果是一样的。我也尝试像print(chunk.head())一样打印它，但零仍然缺失。这可能发生在其他具有零的列上（我没有检查过因为我有大约40列）

有谁知道造成这种行为的原因是什么？

在阅读CSV文件时，Pandas会自动从列中删除零

0 个答案: