在这种情况下,Python pandas数据框架合并如何工作?

时间:2019-05-10 21:25:32

标签: python pandas merge

我正在尝试使用熊猫合并2个Excel工作表。
但是在内部合并中,它会丢失两个数据帧上的1条记录。 并在左侧合并给出一半的数据。

df1=pd.read_excel('output_may_tv.xlsx',sheet_name='Sheet2',index_col=None, header=None,names=['url'])

df2=pd.read_excel('output_may_2.xlsx',sheet_name='metadata',index_col=None, header=None,names=['title','synopsis','rs','rh','bs','bh','url','n','e','site'])


result1=df1.merge(df2,on='url')

最初,result1这样做后减少了1个URL

result1=df1.merge(df2,how='left')

它显示url,但合并的行上缺少其他列数据

请任何人向我解释如何解决此问题。

1 个答案:

答案 0 :(得分:0)

缺少的url是否完全相同,或者它们的大写字母和非大写字母或空格不同?将您的列转换为大写并删除空格:

df1['url'] = df1['url'].str.upper().str.strip()

对df2做同样的事情。 然后尝试再次合并