我有一个推文语料库,其中一些有我要删除的@mentions,我正在使用tm_map
的{{1}}函数,但没有得到所需的结果。这是一个例子:
tm package
因此,我看到任何'字母'正在被正确删除,但'@'条件根本没有变化。但我想删除@ abc,@ xzz基本上以@。
开头的任何“单词”非常感谢任何帮助。
答案 0 :(得分:0)
从WiktorStribiżew那里获取解决问题的方法是
for(j in seq(stripwhitespacetweets))
{
removementions[[j]] <- gsub("@\\w+", " ", stripwhitespacetweets[[j]])
}
来源:https://rstudio-pubs-static.s3.amazonaws.com/31867_8236987cf0a8444e962ccd2aec46d9c3.html