我有两个长度不等的CSV文件,其列有如下所示:
CSV 1
EntryDate
9/3/10
9/27/10
10/5/10
10/11/10
10/20/10
10/25/10
CSV 2
EntryDate
9/7/10
9/27/10
10/11/10
11/3/10
我想比较这两个文件并返回它们共有的日期。我从Python 3开始,在pandas中创建两列数据框。
import pandas as pd
fields = ["StartDate"]
f1= "f1.csv"
df1 = pd.read_csv(f1, skipinitialspace=True, usecols=fields)
f2 = "f2.csv"
df2 = pd.read_csv(f2, skipinitialspace=True, usecols=fields)
我尝试过pd.merge和difflib,但它没有用。我也试过没有运气的人。帮助或方向赞赏。
答案 0 :(得分:0)
假设两个文件都已排序。
制备物:
struct
和file1
其余的:
file2
行大于file1
行,
file2
上拨打下一个并获取下一行file2
行小于file1
行,
file2
上拨打下一个并获取下一行