文本挖掘 - 如何构建术语 - 文档矩阵

时间:2013-12-12 22:57:17

标签: r tm

我要做的是加载csv文件,并转换为term-document矩阵。

以下是我的代码的一部分:

myCorpus<-read.csv('alert-sample-data-4-mining.csv', head=TRUE)
TermDocumentMatrix(myCorpus, control=list(wordLengths=c(1,Inf)))

但是收到一条错误消息说: UseMethod(“TermDocumentMatrix”,x)中的错误:   没有适用于“TermDocumentMatrix”的方法应用于“data.frame”类的对象

1 个答案:

答案 0 :(得分:2)

这里有一些事情 - 你没有加载tm库而你没有创建语料库。尝试这样的事情(假设您的文本数据位于csv文件中名为“text”的字段中):

library(tm)
myCorpus <- read.csv("alert-sample-data-4-mining.csv")
corpus <- Corpus(VectorSource(myCorpus$text))
TermDocumentMatrix(corpus)