我在匹配data frames
的基础上合并两个website
。但是,两个数据框中没有网站的记录很少。这导致我的结果数据框中的错误匹配,因为它还匹配网站字段为空的记录。如何将条件设置为与空字符串不匹配?
df3 = pd.merge(df1,df2,left_on='website1',right_on='website2').sort_values('company_name')
答案 0 :(得分:0)
您可以在合并boolean indexing
之前进行过滤:
df1 = df1[df1.website1 != '']
df2 = df2[df2.website2 != '']
样品:
df1 = pd.DataFrame({'website1':['','aa','bb'],
'a':[4,5,6]})
print (df1)
a website1
0 4
1 5 aa
2 6 bb
df1 = df1[df1.website1 != '']
print (df1)
a website1
1 5 aa
2 6 bb