组合一个热编码的数据帧行

时间:2017-04-20 10:55:09

标签: r

我是“热门编码的”这样的df:

之前的

C1    C2   C3
a     x     5
b     x     5
c     z     5

在一次热编码之后:

Ca   Cb  Cc   C2   C3
1    0   0    x     5
0    1   0    x     5
0    0   0    z     5

如何根据C2和C3列中的相同行(以及一些具有相同行的列)组合行,如下所示:

Ca   Cb   Cc   C2    C3
1    1    0     x    5
0    0    1     z    5

我试图为此找到一个功能但找不到它。 R中是否有任何“标准化”功能?

如果2行具有相似的C2值,但C3值不同,我不想将它们组合起来。基本上只组合那些除了热编码行(Ca,Cb,Cc)中的值之外具有完全相同信息的行。

1 个答案:

答案 0 :(得分:1)

这样的东西?

aggregate(.~C2:C3,df,function(x) sum(x))