Question

我有两个CSV文件。它们实际上每个都有超过200万条记录，但这是一个简化版本：

文件1：

col1
----
1
54
744
45
65

文件2：

col2
----
sdf
322
d3
d
2

将这两者结合起来最快的方法是什么？最后的结论是什么？

col1  |  col2
-------------
1     |  sdf
54    |  322
744   |  d3
45    |  d
65    |  2

我通常会使用Excel或类似的东西，但数据集太大而无法加载。我可以用Pandas来实现这个目标吗？

Answer 1

import pandas as pd
df1 = pd.read_csv("csv1")
df2 = pd.read_csv("csv2")

result = pd.concat([df1, df2], axis=1)

这应该可以解决问题