我有两个CSV文件。它们实际上每个都有超过200万条记录,但这是一个简化版本:
文件1:
col1
----
1
54
744
45
65
文件2:
col2
----
sdf
322
d3
d
2
将这两者结合起来最快的方法是什么?最后的结论是什么?
col1 | col2
-------------
1 | sdf
54 | 322
744 | d3
45 | d
65 | 2
我通常会使用Excel或类似的东西,但数据集太大而无法加载。我可以用Pandas来实现这个目标吗?
答案 0 :(得分:2)
import pandas as pd
df1 = pd.read_csv("csv1")
df2 = pd.read_csv("csv2")
result = pd.concat([df1, df2], axis=1)
这应该可以解决问题