在R中使用tm包进行预处理时出错

时间:2015-03-06 22:48:35

标签: r package tm

我正在尝试用R中的tm包进行一些预处理。我写了以下几行:

corpus <- Corpus(VectorSource(Data))
corpus <- tm_map(corpus , asPlain)
corpus <- tmMap(corpus , removeSignature)

正如你所看到的,我尝试了两个&#39; tm_map&#39;和&#39; tmMap&#39;。但我每次都遇到这些错误:

Error in match.fun(FUN) : object 'asPlain' not found
Error: could not find function "tmMap"

你能帮我解决一下这个错误吗?

1 个答案:

答案 0 :(得分:0)

tm包更改了函数调用,其中一些方法不再可用。

以下是一些带有新功能的示例代码。

require(tm)
text_corpus <- VCorpus( DirSource("20ng_train/sci.electronics"))
corpus_clean <- tm_map(text_corpus, content_transformer(tolower))
corpus_clean <- tm_map(corpus_clean, removeNumbers) 
corpus_clean <- tm_map(corpus_clean, removeWords, stopwords()) 
corpus_clean <- tm_map(corpus_clean, removePunctuation)
corpus_clean <- tm_map(corpus_clean, stemDocument)
corpus_clean <- tm_map(corpus_clean, stripWhitespace)