删除单元格中的重复条目 - R

时间:2016-10-26 17:43:35

标签: r

我在这里搜索高低,并尝试重复和独特的功能,我将要提出的问题,但无法得到任何工作。假设我有一个名为company的数据框,其状态为变量。当我在一个状态变量观察中坍塌行时,我将这个输出留下:

PA;PA;PA;TX;TX

我怎样才能删除单元格内的副本(以及整个向量),所以看起来如下:

PA;TX

我删除重复行没有问题,但似乎无法为单元格本身执行此操作。

1 个答案:

答案 0 :(得分:2)

这适用于单个字符串:

x <- "PA;PA;PA;TX;TX"

x2 <- strsplit(x, ";")

x3 <- unlist(x2)

x4 <- unique(x3)

x5 <- paste(x4, collapse = ";")

如果您想对整个向量company$state执行此操作,则可以将所有内容转换为对sapply的一次调用:

sapply(company$state, function(x) paste(unique(unlist(strsplit(x, ";"))), collapse = ";"))