使用熊猫合并执行查找

时间:2019-08-15 15:29:02

标签: python-3.x pandas

我已经在网站上查询并看到了很多答案,并试图修改它们以完成我想要的操作,但是由于某种原因,我没有得到结果。

我有两个数据帧,一个具有数百万行的Big_df,具有10列,另一个具有1000行,具有6列,具有Small_df。

Small_df的列为“ Print_ID”,而Big_df的列为“ Job_ID”,与数据框相同。我需要从Big_df检索“状态”列并将其添加到Small_df。这是代码:

NewSmall_df = pd.merge(Small_df, Big_df, left_on = 'Print_ID', right_on ='Job_ID')

我得到2000多个行的结果,这是不正确的,因为Small_df有1000行,根据ID之一中是否有NaN,最大值将为1000或更小。我已经在Stackoverflow和其他地方查看了所有类似类型问题的答案,我应该得到想要的结果。

我正在寻找的结果是在small_df中添加了一个额外的列,该列具有Big_df中的'状态'与Print_ID和Job_ID相匹配。

我在做什么错?任何帮助将不胜感激。

以下是示例数据:

Small_df: Smal_df

Big_df: Big_df

Result_df: Result_df after matching Print_ID and Job_ID to return Status as the last column

0 个答案:

没有答案