Pandas合并创建非常大的文件

时间:2016-01-11 23:36:30

标签: python csv pandas merge

我正在尝试使用以下内容合并两个数据帧df1和df2:

df3 = pd.merge(df1, df2, how='outer', left_on='Computer', right_on='prod_computer')

创建df1的csv文件大约为1.6MB,而df2的另一个文件大小为240KB。但是,在合并之后,我从df3中获取的csv文件大约是14MB!我不明白发生了什么。这是一个非常简单的合并。此外,我做了两个其他合并,最后一个csv文件大小增长到500MB。任何帮助表示赞赏。

1 个答案:

答案 0 :(得分:0)

由于数据框中的匹配键,您的结果可能会超出预期。要对此进行测试,请在合并之前删除所有duplicates