使用Rcpp删除句子的停用词

时间:2017-06-24 00:11:57

标签: c++ r nlp data.table rcpp

我想使用Rcpp基于另一个向量的停用词替换句子的单词。 R中的示例如下:

library(stringr)
library(tm)

x <- "I love eating burgers every day and night"
idVector <- str_split(x,pattern = " ")[[1]]
idVector <- idVector[!idVector %in% stopwords(kind = "en")]
idVector <- paste0(idVector, collapse = " ")
print(idVector)

我有兴趣创建一个Rcpp函数并在data.table的行上执行一个组,以便清理大量的句子。使用当前的方法需要花费大量的时间。

提前致谢!

0 个答案:

没有答案