应用错误收集

我在scala中有两个数据帧，我通过hive上下文使用sql查询创建它们，请在此处查看df作为图像

另一个数据框如下

请忽略第二个df中重复的标题，我想比较两个数据框中的技能列，并获得等效的角色，技能2并在df1中出现，即demand_df，

我在pandas中试过这个并且能够通过使用以下代码段来实现

df1 = pd.DataFrame（[[“INDIA”，“XXX”，“developer”，“UNKNOWN”，121]，[“INDIA”，“XXXX”，“software engineer”，“UNKNOWN”，121] ，[“波兰”，“XX”，“英语”，“已知”，12 2]]，列= ['国家'，'等级'，'技能'，'r2d2'，'税']）
df2 = pd.DataFrame（[[“english”，“NaN”，“teacher”，“NaN”，“NaN”]，[20000，“Unknown”，“NaN”，“NaN”，“N” aN“]，[”microsoft“，”K nown“，”Software Engineer“，”Microsoft“，”Enterprise“]]，columns = ['Skill'，'R2D2'，'Role'，'Skill2'，'新兴']）

result = df1.merge（df2 [['Skill'，'Role'，'Skill2'，'emerging']]，how ='left'，left_on ='Skill'，right_on ='Skill'）

请指导我，因为我是scala的新手