熊猫get_dummies用于重复索引

时间:2019-01-25 06:17:04

标签: pandas dataframe

我有一个像这样的数据框:

UserId  Watched
553938  item1
553938  item2
553938  item3
309611  item4

在这里,UserId是我的索引列。我想将此数据帧转换为类似“一键编码”矩阵的格式,其中每个项目都是一个功能。 所以,我想要一个像这样的矩阵:

UserId  item1   item2    item3   item4  
553938   1        1        1       0
309611   0        0        0       1

但是,当我使用pd.get_dummies(df)时,会得到以下数据框:

UserId  item1   item2    item3   item4  
553938   1        0        0       0
553938   0        1        0       0
553938   0        0        1       0
309611   0        0        0       1

之所以发生这种情况,是因为我的原始数据帧包含重复的userId(这也是我的索引)的固有结构

有没有一种方法可以实现所需的数据框?

0 个答案:

没有答案