如何使用2个数据框填写表格

时间:2018-12-28 01:29:37

标签: python pandas dataframe

我有一个数据帧,看起来像一个表格,如下所示:

1. DueDate    |    item1    |     item2    |    item3    |    item4

2. 1/1/2018   |     nan     |      nan     |     nan     |     nan
3. 1/2/2018   |     nan     |      nan     |     nan     |     nan
4. 1/3/2018   |     nan     |      nan     |     nan     |     nan
5. 1/4/2018   |     nan     |      nan     |     nan     |     nan
6. 1/5/2018   |     nan     |      nan     |     nan     |     nan

我还有另一个数据框,如下表所示:

1. DueDate    |    items 

2. 1/1/2018   |     item1
3. 1/2/2018   |     item3
4. 1/2/2018   |     item4    
5. 1/4/2018   |     item4   
6. 1/5/2018   |     item1
7. 1/5/2018   |     item3

我想用匹配的日期和项填充第一个表,如下所示:

1. DueDate    |    item1    |     item2    |    item3    |    item4

2. 1/1/2018   |     YES     |      nan     |     nan     |     nan
3. 1/2/2018   |     nan     |      nan     |     YES     |     YES
4. 1/3/2018   |     nan     |      nan     |     nan     |     nan
5. 1/4/2018   |     nan     |      nan     |     nan     |     YES
6. 1/5/2018   |     YES     |      nan     |     YES     |     nan

我该怎么做,我做了很多尝试,但我很不幸。 先感谢您!

1 个答案:

答案 0 :(得分:2)

您可以将下面的get_dummies分配给df1

df1[df2['items'].str.get_dummies().columns]=df2['items'].str.get_dummies().replace(1,'YES').replace(0,pd.np.nan)

现在:

print(df1)

是:

    DueDate item1  item2 item3 item4
0  1/1/2018   YES    NaN   NaN   NaN
1  1/2/2018   NaN    NaN   YES   NaN
2  1/3/2018   NaN    NaN   NaN   YES
3  1/4/2018   NaN    NaN   NaN   YES
4  1/5/2018   YES    NaN   NaN   NaN