R在数据帧的列中标识文本字符串

时间:2012-09-13 15:06:23

标签: r

我的数据框的一列有单词和短语。我正在尝试为此列中的那些字段创建一个虚拟变量,其中包含特定的文本字符串。

例如:

  • 风筝
  • 汽车
  • 盒子风筝
  • 模型车
  • 我喜欢放风筝
  • 世界汽车

     myvector<-c("kite","cars","box kites","model cars","i like kites that fly",
     "cars of the world")
    

我想用字符串“kite”识别所有字段

我尝试了一些诸如any()which()%in%之类的内容,但到目前为止还没有任何工作。

任何帮助非常感谢

1 个答案:

答案 0 :(得分:20)

您没有提供任何可重复的示例。但你的回答将是grepl。

grepl("kite", df$words)

如果单词在行中,它将返回逻辑向量。

如果要匹配多个单词,请在字符串中使用逻辑或|来匹配

grepl("kite|cars|box kites", df$words)