我有一个名为' data.csv'的csv。它有:
EmployeeIDNumber
A
B
C
D
我有另一个名为' basic.csv'它有相同的数据但是混乱:
MemberIdentifier
B
A
C
我想使用PANDAS创建一个结果表:
EmployeeIDNumber MemberIdentifier
A A
B B
C C
D Not Found
答案 0 :(得分:1)
有几种方法可以做到这一点,但最强大的是以下,
import pandas as pd
df1 = pd.csv_read('data.csv')
df = merge(df1, df2, left_on='EmployeeIDNumber', right_on='MemberIdentifier', how='left')
我们在这里选择我们希望加入DataFrames的特定列。如果您还希望在MemberIdentifier
列中包含与EmployeeIDNumber
列中的任何内容都不匹配的任何阅读内容,那么您可以设置how='outer'
。