合并数据帧同时排除空记录

时间:2016-07-05 19:20:10

标签: python string pandas dataframe conditional-statements

我在匹配data frames的基础上合并两个website。但是,两个数据框中没有网站的记录很少。这导致我的结果数据框中的错误匹配,因为它还匹配网站字段为空的记录。如何将条件设置为与空字符串不匹配?

df3 = pd.merge(df1,df2,left_on='website1',right_on='website2').sort_values('company_name')

1 个答案:

答案 0 :(得分:0)

您可以在合并boolean indexing之前进行过滤:

df1 = df1[df1.website1 != '']
df2 = df2[df2.website2 != '']

样品:

df1 = pd.DataFrame({'website1':['','aa','bb'],
                   'a':[4,5,6]})

print (df1)
   a website1
0  4         
1  5       aa
2  6       bb

df1 = df1[df1.website1 != '']
print (df1)
   a website1
1  5       aa
2  6       bb