我已经在网站上查询并看到了很多答案,并试图修改它们以完成我想要的操作,但是由于某种原因,我没有得到结果。
我有两个数据帧,一个具有数百万行的Big_df,具有10列,另一个具有1000行,具有6列,具有Small_df。
Small_df
的列为“ Print_ID”,而Big_df
的列为“ Job_ID”,与数据框相同。我需要从Big_df
检索“状态”列并将其添加到Small_df
。这是代码:
NewSmall_df = pd.merge(Small_df, Big_df, left_on = 'Print_ID', right_on ='Job_ID')
我得到2000多个行的结果,这是不正确的,因为Small_df
有1000行,根据ID之一中是否有NaN
,最大值将为1000或更小。我已经在Stackoverflow和其他地方查看了所有类似类型问题的答案,我应该得到想要的结果。
我正在寻找的结果是在small_df
中添加了一个额外的列,该列具有Big_df
中的'状态'与Print_ID和Job_ID相匹配。
我在做什么错?任何帮助将不胜感激。
以下是示例数据:
Small_df: Smal_df
Big_df: Big_df
Result_df: Result_df after matching Print_ID and Job_ID to return Status as the last column