从不同的数据集(字符)中提取重叠的名称

时间:2014-07-18 14:18:20

标签: r

有没有简单的方法可以从不同的数据集中找到重叠的名称?

> class(list1)
[1] "character"

所以,让我们说我有这样的数据:

list1 <- c("Mark", "Greg", "Max", "Gregor", "Paul", "JAck", "Marcus")
list2 <- c("Chris", "Jackson", "Mark", "Michael", "Gena", "Greg")
list3 <- c("Susane", "Mark", "Monica", "Chistopher", "Henry", "Atos", "Greg")
list4 <- c("Peter", "Marie", "Mark", "Greg", "Denice", "Daryl", "Maros", "Gert", "Suar")

所有数据中唯一的名称是:

Mark and Greg

如何使用R找到这样的重叠?我的数据要大得多,这就是我使用示例的原因。

2 个答案:

答案 0 :(得分:3)

您可以使用:

Reduce(intersect, list(list1, list2, list3, list4))

答案 1 :(得分:1)

如果qdap确实包含list4,则采用Mark方法:

library(qdap)
common(list1, list2, list3, list4)

## > common(list1, list2, list3, list4)
##   word freq
## 1 Greg    4
## 2 Mark    4