尝试过重塑/融化和演员,可以得到我需要的输出。
只需转动/非规范化数据即可。我需要一个给定RANK的UPC列表,所以我可以对输出数据做一些arules。任何输入都非常感谢。
将我的CSV文件加载到数据框中。
md1 <- read.csv("sltrndtlfew.csv")[,2:3]
> md1
RNK UPC
1 152221 725942843866
2 152221 882486415420
3 152221 723764327359
4 152221 882486419664
5 124578 884884731010
............
............
RNK UPC
152221 725942843866
152221 882486415420
152221 723764327359
152221 882486419664
124578 884884731010 <-
152221 886127223733
152221 732999083107
152221 732999090211
152221 732999083114
152221 883810901558
152221 732998067597
124578 634859192779 <-
152221 725942807578
152221 737445543587
152221 883810941127
124578 733004256219 <-
263945 91709433725
263945 91709433725
263945 91709433725
263945 91709433725
263945 91709433725
263945 91709433725
263945 91709433725
263945 91709433725
152221 725942843866,882486415420,723764327359....
124578 884884731010,634859192779, 733004256219
263945 91709433725, 91709433725.....
答案 0 :(得分:1)
你可以这样做:
library(dplyr)
results <- md1 %>%
group_by(RNK) %>%
summarise(listing = toString(UPC))
as.data.frame(results)