我是“热门编码的”这样的df:
之前的:
C1 C2 C3
a x 5
b x 5
c z 5
在一次热编码之后:
Ca Cb Cc C2 C3
1 0 0 x 5
0 1 0 x 5
0 0 0 z 5
如何根据C2和C3列中的相同行(以及一些具有相同行的列)组合行,如下所示:
Ca Cb Cc C2 C3
1 1 0 x 5
0 0 1 z 5
我试图为此找到一个功能但找不到它。 R中是否有任何“标准化”功能?
如果2行具有相似的C2值,但C3值不同,我不想将它们组合起来。基本上只组合那些除了热编码行(Ca,Cb,Cc)中的值之外具有完全相同信息的行。
答案 0 :(得分:1)
这样的东西?
aggregate(.~C2:C3,df,function(x) sum(x))