当前,尝试按流派过滤R中的IMDb评级数据帧的子集。使用以下命令averageRatingHorror = subset(df_ratings, df_ratings$genres == "Horror")
我知道这会使数据帧的子集仅显示与“恐怖”具有相同类型的结果,但是某些电影包含多个类型。例如“恐怖,幻想”。我在SQL中看到过类似的事情,在此之后,您使用%来表示任何含义,但有时Horror并不是列表中的第一件事。
所以我的问题是,如何通过包含“恐怖”而不是等于“恐怖”来使命令适应子集
编辑:averageRatingHorror = subset(df_ratings, grepl("Horror", genres))
如下,感谢提供帮助的人。
答案 0 :(得分:0)
您还可以使用package package stringi。
library(stringi)
stri_detect_fixed(df_ratings$genres,"Horror")