查找向量中所有出现的字符串(grep(),其中()函数不能正常工作)

时间:2018-04-28 00:05:51

标签: r grepl

我有这个spreadsheet,想看看字符串“Drake”出现的频率。

例如,有些行说“Drake,Kendrick Lamar,Post Malone”,但它们并没有被我的代码计算:

data <- read.csv("C:/Users/Gabriel/Documents/responses.csv", header = TRUE)

artist <- data$artists
grep("Drake$", artist)

artistcount <- which('Drake' == artist)
artistcount

我从grep()which()得到的结果都是

# 7 47 71

我想要出现“Drake”的所有行。此代码显示哪些行具有“Drake”作为唯一字符串。它应该不仅仅是3行。 我感谢任何反馈。

以下是“艺术家”专栏中数据的示例:

enter image description here

1 个答案:

答案 0 :(得分:1)

这可以使用dplyr中的过滤器函数和来自stringr的str_detech来完成。

 library(stringr)
 library(dplyr)
 data <- read.csv(choose.files())
 drake <- data %>%
   filter(str_detect(artists, "Drake"))