Question

当前，尝试按流派过滤R中的IMDb评级数据帧的子集。使用以下命令averageRatingHorror = subset(df_ratings, df_ratings$genres == "Horror")

我知道这会使数据帧的子集仅显示与“恐怖”具有相同类型的结果，但是某些电影包含多个类型。例如“恐怖，幻想”。我在SQL中看到过类似的事情，在此之后，您使用％来表示任何含义，但有时Horror并不是列表中的第一件事。

所以我的问题是，如何通过包含“恐怖”而不是等于“恐怖”来使命令适应子集

编辑：averageRatingHorror = subset(df_ratings, grepl("Horror", genres))如下，感谢提供帮助的人。

Answer 1

您还可以使用package package stringi。

library(stringi)
stri_detect_fixed(df_ratings$genres,"Horror")