使用'tm'包R

时间:2016-03-03 12:20:32

标签: regex r tm

我有一个推文语料库,其中一些有我要删除的@mentions,我正在使用tm_map的{​​{1}}函数,但没有得到所需的结果。这是一个例子:

tm package

因此,我看到任何'字母'正在被正确删除,但'@'条件根本没有变化。但我想删除@ abc,@ xzz基本上以@。

开头的任何“单词”

非常感谢任何帮助。

1 个答案:

答案 0 :(得分:0)

从WiktorStribiżew那里获取解决问题的方法是

for(j in seq(stripwhitespacetweets))   
   {   
     removementions[[j]] <- gsub("@\\w+", " ", stripwhitespacetweets[[j]])   
  } 

来源:https://rstudio-pubs-static.s3.amazonaws.com/31867_8236987cf0a8444e962ccd2aec46d9c3.html