我正在对R Studio中的排序数据进行一些数据转换。我想从我的测序数据中获得独特的渠道。这是一个示例-
sequence = c("a > b", "b > c > a > d", "f")
success = c(0,1,0)
df = data.frame(sequence,success)
df
> df
sequence success
1 a > b 0
2 b > c > a > d 1
3 f 0
在这种情况下,我想获得所有独特的渠道。所以我的输出应该像-
> unique_channels
a
b
c
d
f
请注意,我的df$sequence
中的分隔符固定为>
答案 0 :(得分:4)
如果分隔符是固定的,那么您只需要拆分字符串并计算唯一元素:
unique_channels <- unique(unlist(strsplit(sequence, ' > ')))