我的数据框的一列有单词和短语。我正在尝试为此列中的那些字段创建一个虚拟变量,其中包含特定的文本字符串。
例如:
世界汽车
myvector<-c("kite","cars","box kites","model cars","i like kites that fly",
"cars of the world")
我想用字符串“kite”识别所有字段
我尝试了一些诸如any()
,which()
和%in%
之类的内容,但到目前为止还没有任何工作。
任何帮助非常感谢
答案 0 :(得分:20)
您没有提供任何可重复的示例。但你的回答将是grepl。
grepl("kite", df$words)
如果单词在行中,它将返回逻辑向量。
如果要匹配多个单词,请在字符串中使用逻辑或|
来匹配
grepl("kite|cars|box kites", df$words)