我正在关注建立完整搜索的this tutorial
他们说:
library(Snowball)
my.corpus <- tm_map(my.corpus, stemDocument)
my.corpus$doc1
但据我所知,Snowball以及SnowballC已被弃用。 我尝试了RStem,但它给了我语料库的错误......我怎样才能阻止我的语料库?
#load
my.docs <- VectorSource(c(doc.list, query))
my.docs$Names <- c(names(doc.list), "query")
my.corpus <- Corpus(my.docs)
my.corpus <- tm_map(my.corpus, removePunctuation)
# HOW TO STEM?????
my.corpus <- tm_map(my.corpus, removeNumbers)
my.corpus <- tm_map(my.corpus, tolower)
my.corpus <- tm_map(my.corpus, stripWhitespace)
inspect(my.corpus)