我在R中使用tm包在我的语料库中做词干。但是,当我运行DocumentTermMartix
时出现问题“UseMethod中的错误(”meta“,x):没有适用的方法 'try-error'应用于类“character”的对象
这是我的工作流程:
library(tm)
myCorpus <- Corpus(VectorSource(training$FullDescription))
myCorpus <- tm_map(myCorpus, content_transformer(tolower), lazy=TRUE)
myCorpus <- tm_map(myCorpus, removePunctuation, lazy=TRUE)
myCorpus <- tm_map(myCorpus, removeNumbers, lazy=TRUE)
myStopwords <- c(stopwords('english'), "available", "via")
myCorpus <- tm_map(myCorpus, removeWords, myStopwords, lazy=TRUE)
dictCorpus <- myCorpus
myCorpus <- tm_map(myCorpus, stemDocument, lazy=TRUE)
myCorpus <- tm_map(myCorpus, stemCompletion, dictionary=dictCorpus, lazy=TRUE)
myDtm <- DocumentTermMatrix(myCorpus, control=list(wordLengths=c(1, Inf),
bounds=list(global=c(floor(length(myCorpus)*0.05), Inf))))
我尝试使用'global bounds'参数来限制像我代码的最后一行这样的术语数量,但我仍然无法解决这个问题。我该如何解决这个问题?