R不能阻止我的语料库

时间:2015-01-21 10:21:42

标签: r nlp stemming

我正在关注建立完整搜索的this tutorial

他们说:

library(Snowball)
my.corpus <- tm_map(my.corpus, stemDocument)
my.corpus$doc1

但据我所知,Snowball以及SnowballC已被弃用。 我尝试了RStem,但它给了我语料库的错误......我怎样才能阻止我的语料库?

#load
my.docs <- VectorSource(c(doc.list, query))
my.docs$Names <- c(names(doc.list), "query")

my.corpus <- Corpus(my.docs)

my.corpus <- tm_map(my.corpus, removePunctuation)

# HOW TO STEM?????
my.corpus <- tm_map(my.corpus, removeNumbers)
my.corpus <- tm_map(my.corpus, tolower)
my.corpus <- tm_map(my.corpus, stripWhitespace)

inspect(my.corpus)

0 个答案:

没有答案