使用熊猫数据帧稍微修改后,CSV文件会改变大小

时间:2018-04-16 17:27:29

标签: python csv dataframe size

我正在读取CSV文件并将其保存为熊猫数据框,更改它,然后将其另存为另一个CSV文件。问题是行数和列数以及每个元素数据大小在此过程中保持不变,但输入和输出CSV文件的大小差别很大(输入= 132 kB,输出= 139 KB)。我很难理解发生了什么。我怀疑编码,并在阅读和写作时将它们强制为同一类型,但问题仍然存在。

更重要的是,如果我手动打开输出文件并更改单个元素(比如只更改1到2),文件的大小会回到132 KB,这是我所期望的。以下是我正在使用的代码供您参考:

    user_df = pd.read_csv("input.csv")
    answer = pd.DataFrame(columns=['question','worker','answer'])

复制用户数据帧的某些字段以回答数据帧后:

    answer.to_csv("output.csv")  

非常感谢

0 个答案:

没有答案