处理在数据框的另一列中具有不同值的重复项

时间:2014-06-05 07:09:12

标签: r duplicates match

我有一个大型数据框,为了清晰起见,其列试图简化如下。

 refined.data  value            rawdata
        ab         4               wd
        cd         8               ab
        ef         9y              cd
        ab         5p              gh
        gh         7               tg
        cd         6k              hg
        ef         3q              ef
        tg         9w              pw
        wq         10              dz

refined.data列包含一些元素,其中一些元素在同一列中重复,但在Value列中具有唯一值。 我希望生成一个包含两列的新数据框,其中rawdata列已与refined.data列匹配。匹配应与其对应的列values(唯一)链接,如下所示。所需结果

NewDataFrame=

matches         value
ab                4
ab                5p
cd                8
cd                6k
ef                9y
ef                3q
tg                9w
wq                10

所以我应该如何在两列中循环,这样如果它遇到第一个匹配,它应该在列value中附加一个相应的值,第二个匹配也应该附加其相应的值直到所有的匹配单个元素已耗尽。 例如。

           matches   value
1st match of `ab`     4
2nd match of `ab`     5p

换句话说,应保留matches列中的重复项,但Values应该是唯一的

任何建议都会被邀请并且会受到赞赏。字面意思是stack.cant在没有先解决这个"混乱" .am绿色的情况下做一件事

0 个答案:

没有答案