所以我试图删除318591字符串向量的停用词。
通过这样做,我正在使用这个
X<-lapply(articles_and_id[,2], function(x) {
t <- unlist(strsplit(x, " "))
t[t %nin% stopWords]
我的字符串被拆分,最终显示在这样的列表中:
>X[[1]]
[[1]]
[1] "new" "relictual" "highly" "troglomorphic" "species" "tomoceridae" "collembola"
[8] "deep" "croatian" "cave"
所以我想把它放回到数据帧中,将其转换为以下形式:
1 new, relictual, highly, troglomorphic, species, tomoceridae, collembola, deep, croatian, cave
我正在使用:
articles_and_id[,2] <- lapply(X,toString)
但它只是无穷无尽!!!!
有关如何改善这一点的任何建议?如果我停止运行
答案 0 :(得分:1)
您可以使用:
articles_and_id[,2] <- sapply(X,paste, collapse=" ")