我有一个大型数据框,为了清晰起见,其列试图简化如下。
refined.data value rawdata
ab 4 wd
cd 8 ab
ef 9y cd
ab 5p gh
gh 7 tg
cd 6k hg
ef 3q ef
tg 9w pw
wq 10 dz
refined.data
列包含一些元素,其中一些元素在同一列中重复,但在Value
列中具有唯一值。
我希望生成一个包含两列的新数据框,其中rawdata
列已与refined.data
列匹配。匹配应与其对应的列values
(唯一)链接,如下所示。所需结果
NewDataFrame=
matches value
ab 4
ab 5p
cd 8
cd 6k
ef 9y
ef 3q
tg 9w
wq 10
所以我应该如何在两列中循环,这样如果它遇到第一个匹配,它应该在列value
中附加一个相应的值,第二个匹配也应该附加其相应的值直到所有的匹配单个元素已耗尽。
例如。
matches value
1st match of `ab` 4
2nd match of `ab` 5p
换句话说,应保留matches
列中的重复项,但Values
应该是唯一的
任何建议都会被邀请并且会受到赞赏。字面意思是stack.cant在没有先解决这个"混乱" .am绿色的情况下做一件事