我使用以下代码读取CSV文件,替换空值并将结果写入另一个文件:
with open('result.csv', 'a') as f:
for chunk in pd.read_csv('personaldata.csv', chunksize=10000):
chunk.fillna('N/A', inplace=True)
chunk.to_csv(f, sep=',', index=False)
此代码工作正常并用N/A
替换空值,但问题是所有在开头都有零(0)的列都会删除这些值。
我的CSV文件如下所示:
id,CompanyNumber,oldAppointmentType
1, 00000006, "Current Secretary"
5, 00000058, "Current Secretary"
当我在新文件中写入结果时,列CompanyNumber
如下所示:
CompanyNumber
6
58
我认为这可能是因为我正在使用chunksize
所以,我将文件分成几个文件并尝试没有chunksize
,但结果是一样的。我也尝试像print(chunk.head())
一样打印它,但零仍然缺失。这可能发生在其他具有零的列上(我没有检查过因为我有大约40列)
有谁知道造成这种行为的原因是什么?