我有一个数据帧,看起来像一个表格,如下所示:
1. DueDate | item1 | item2 | item3 | item4
2. 1/1/2018 | nan | nan | nan | nan
3. 1/2/2018 | nan | nan | nan | nan
4. 1/3/2018 | nan | nan | nan | nan
5. 1/4/2018 | nan | nan | nan | nan
6. 1/5/2018 | nan | nan | nan | nan
我还有另一个数据框,如下表所示:
1. DueDate | items
2. 1/1/2018 | item1
3. 1/2/2018 | item3
4. 1/2/2018 | item4
5. 1/4/2018 | item4
6. 1/5/2018 | item1
7. 1/5/2018 | item3
我想用匹配的日期和项填充第一个表,如下所示:
1. DueDate | item1 | item2 | item3 | item4
2. 1/1/2018 | YES | nan | nan | nan
3. 1/2/2018 | nan | nan | YES | YES
4. 1/3/2018 | nan | nan | nan | nan
5. 1/4/2018 | nan | nan | nan | YES
6. 1/5/2018 | YES | nan | YES | nan
我该怎么做,我做了很多尝试,但我很不幸。 先感谢您!
答案 0 :(得分:2)
您可以将下面的get_dummies
分配给df1
:
df1[df2['items'].str.get_dummies().columns]=df2['items'].str.get_dummies().replace(1,'YES').replace(0,pd.np.nan)
现在:
print(df1)
是:
DueDate item1 item2 item3 item4
0 1/1/2018 YES NaN NaN NaN
1 1/2/2018 NaN NaN YES NaN
2 1/3/2018 NaN NaN NaN YES
3 1/4/2018 NaN NaN NaN YES
4 1/5/2018 YES NaN NaN NaN