我正在尝试比较一个数据框的一小部分,以检查是否存在其他带有熊猫的数据框。
例如:
Dataframe1
id state
1111 M
2222 A
3333 A
4444 M
5555 A
6666 M
Dataframe2
ids status
8888 M
2222 A
3333 A
4444 M
5555 C
6666 M
如您所见,这些数据帧的标头不同。 我想获取Dataframe1的每一行,并检查Dataframe2的相应列(id-> ids,state-> status)中是否同时存在两个列(id和state)
我现在是从熊猫开始的,所以如果这个问题以前已经有人提出过,我感到抱歉。
我正在尝试下面的代码,但是我只能比较一个列,而不能比较其余列。
first_data = pandas.read_csv(first_csv, usecols=["id", "state"])
second_data = pandas.read_csv(second_csv, usecols=["ids", "status"])
print first_data["id"].isin(second_data["ids"])
这是正确的方法吗?
谢谢!