我想使用Rcpp
基于另一个向量的停用词替换句子的单词。 R
中的示例如下:
library(stringr)
library(tm)
x <- "I love eating burgers every day and night"
idVector <- str_split(x,pattern = " ")[[1]]
idVector <- idVector[!idVector %in% stopwords(kind = "en")]
idVector <- paste0(idVector, collapse = " ")
print(idVector)
我有兴趣创建一个Rcpp
函数并在data.table
的行上执行一个组,以便清理大量的句子。使用当前的方法需要花费大量的时间。
提前致谢!