我有一个包含名称的数据集。 它看起来像这样:
name1,name2
name4
name55,name25,name88
我有另一个数据集,其列包含行,这些行具有名称。 我想找到第一个数据集中找到的行的索引。
所以:
nameColumn
name4
name25
应找到指数1和2。 我正在尝试这个:
which(mainDataset$namesColumn == namesDataset, arr.ind=TRUE)
但这不对。 在这里使用某种运算符吗?
非常欢迎帮助!
答案 0 :(得分:1)
如果您的两个数据集如下:
namesDataset <- read.csv(text = "name1,name2
name4
name55,name25,name88", header = FALSE)
mainDataset <- read.csv(text = "nameColumn
name4
name25")
...然后您可以在'namesDataset'中的'nameDataset'中的矢量'nameColumn'中找到名称索引,如下所示:
which(mainDataset$nameColumn %in% unlist(namesDataset))
# [1] 1 2