我正在尝试使用熊猫合并2个Excel工作表。
但是在内部合并中,它会丢失两个数据帧上的1条记录。
并在左侧合并给出一半的数据。
df1=pd.read_excel('output_may_tv.xlsx',sheet_name='Sheet2',index_col=None, header=None,names=['url'])
df2=pd.read_excel('output_may_2.xlsx',sheet_name='metadata',index_col=None, header=None,names=['title','synopsis','rs','rh','bs','bh','url','n','e','site'])
result1=df1.merge(df2,on='url')
最初,result1这样做后减少了1个URL
result1=df1.merge(df2,how='left')
它显示url,但合并的行上缺少其他列数据
请任何人向我解释如何解决此问题。
答案 0 :(得分:0)
缺少的url是否完全相同,或者它们的大写字母和非大写字母或空格不同?将您的列转换为大写并删除空格:
df1['url'] = df1['url'].str.upper().str.strip()
对df2做同样的事情。 然后尝试再次合并