Question

我有这个spreadsheet，想看看字符串“Drake”出现的频率。

例如，有些行说“Drake，Kendrick Lamar，Post Malone”，但它们并没有被我的代码计算：

data <- read.csv("C:/Users/Gabriel/Documents/responses.csv", header = TRUE)

artist <- data$artists
grep("Drake$", artist)

artistcount <- which('Drake' == artist)
artistcount

我从grep()或which()得到的结果都是

# 7 47 71

我想要出现“Drake”的所有行。此代码显示哪些行具有“Drake”作为唯一字符串。它应该不仅仅是3行。我感谢任何反馈。

以下是“艺术家”专栏中数据的示例：

Answer 1

这可以使用dplyr中的过滤器函数和来自stringr的str_detech来完成。

 library(stringr)
 library(dplyr)
 data <- read.csv(choose.files())
 drake <- data %>%
   filter(str_detect(artists, "Drake"))

查找向量中所有出现的字符串（grep（），其中（）函数不能正常工作）

1 个答案: