我正在读取CSV文件并将其保存为熊猫数据框,更改它,然后将其另存为另一个CSV文件。问题是行数和列数以及每个元素数据大小在此过程中保持不变,但输入和输出CSV文件的大小差别很大(输入= 132 kB,输出= 139 KB)。我很难理解发生了什么。我怀疑编码,并在阅读和写作时将它们强制为同一类型,但问题仍然存在。
更重要的是,如果我手动打开输出文件并更改单个元素(比如只更改1到2),文件的大小会回到132 KB,这是我所期望的。以下是我正在使用的代码供您参考:
user_df = pd.read_csv("input.csv")
answer = pd.DataFrame(columns=['question','worker','answer'])
复制用户数据帧的某些字段以回答数据帧后:
answer.to_csv("output.csv")
非常感谢