Question

我有一个包含名称的数据集。它看起来像这样：

name1,name2
name4
name55,name25,name88

我有另一个数据集，其列包含行，这些行具有名称。我想找到第一个数据集中找到的行的索引。

所以：

nameColumn
name4
name25

应找到指数1和2。我正在尝试这个：

which(mainDataset$namesColumn == namesDataset, arr.ind=TRUE)

但这不对。在这里使用某种运算符吗？

非常欢迎帮助！

Answer 1

如果您的两个数据集如下：

namesDataset <- read.csv(text = "name1,name2
name4
name55,name25,name88", header = FALSE)

mainDataset <- read.csv(text = "nameColumn
name4
name25")

...然后您可以在'namesDataset'中的'nameDataset'中的矢量'nameColumn'中找到名称索引，如下所示：

which(mainDataset$nameColumn %in% unlist(namesDataset))
# [1] 1 2