在阅读CSV文件时,Pandas会自动从列中删除零

时间:2017-01-25 09:07:31

标签: python pandas

我使用以下代码读取CSV文件,替换空值并将结果写入另一个文件:

with open('result.csv', 'a') as f:
    for chunk in pd.read_csv('personaldata.csv', chunksize=10000):
        chunk.fillna('N/A', inplace=True)
        chunk.to_csv(f, sep=',', index=False)

此代码工作正常并用N/A替换空值,但问题是所有在开头都有零(0)的列都会删除这些值。

我的CSV文件如下所示:

id,CompanyNumber,oldAppointmentType
1, 00000006,     "Current Secretary"
5, 00000058,     "Current Secretary"

当我在新文件中写入结果时,列CompanyNumber如下所示:

CompanyNumber
       6
      58

我认为这可能是因为我正在使用chunksize所以,我将文件分成几个文件并尝试没有chunksize,但结果是一样的。我也尝试像print(chunk.head())一样打印它,但零仍然缺失。这可能发生在其他具有零的列上(我没有检查过因为我有大约40列)

有谁知道造成这种行为的原因是什么?

0 个答案:

没有答案