我正在尝试用R中的tm包进行一些预处理。我写了以下几行:
corpus <- Corpus(VectorSource(Data))
corpus <- tm_map(corpus , asPlain)
corpus <- tmMap(corpus , removeSignature)
正如你所看到的,我尝试了两个&#39; tm_map&#39;和&#39; tmMap&#39;。但我每次都遇到这些错误:
Error in match.fun(FUN) : object 'asPlain' not found
Error: could not find function "tmMap"
你能帮我解决一下这个错误吗?
答案 0 :(得分:0)
tm包更改了函数调用,其中一些方法不再可用。
以下是一些带有新功能的示例代码。
require(tm)
text_corpus <- VCorpus( DirSource("20ng_train/sci.electronics"))
corpus_clean <- tm_map(text_corpus, content_transformer(tolower))
corpus_clean <- tm_map(corpus_clean, removeNumbers)
corpus_clean <- tm_map(corpus_clean, removeWords, stopwords())
corpus_clean <- tm_map(corpus_clean, removePunctuation)
corpus_clean <- tm_map(corpus_clean, stemDocument)
corpus_clean <- tm_map(corpus_clean, stripWhitespace)