在R中无法检查文本语料库

时间:2015-02-03 17:14:55

标签: r text text-mining tm

我正在尝试创建语料库以进行进一步分析,我展示的代码你突然停止工作,我找不到这个错误的解决方案。我执行这个:

library("tm")
library("SnowballC")
library("wordcloud")
library("arules")
library("arulesViz")
#library("e1071")

#WCZYTAJ_DANE######################################################################

setwd("D:/Dysk Google/Shared/SGGW/MGR_R2/Metody Eksploracji Danych/_PROJEKT")
smSPAM <- read.table("smSPAM.txt", sep="\t", quote="", stringsAsFactors = F)
dim(smSPAM)
colnames(smSPAM) <- c("class", 'text')
head(smSPAM,50)

#zamienia spam ham na 1 0
smSPAM$class=ifelse(smSPAM$class=="ham", "0", "1")
head(smSPAM$text,50)
#View(smSPAM[smSPAM$class=="1",])

#STWORZ_KORPUS#####################################################################

#tworze korpus na potrzeby documenttermmatrix
smSPAM.corp <- Corpus(VectorSource(smSPAM$text))
inspect(smSPAM.corp)

但我在日志中收到此错误:

Error in (function (classes, fdef, mtable):
unable to find an inherited method for function ‘inspect’ for signature ‘"VCorpus"’

然而,我仍然可以在这个语料库上执行词干,删除空格等,只有检查不起作用。

1 个答案:

答案 0 :(得分:2)

好的,我发现我的问题是什么 - tm和arules包包含检查功能我是否必须分离arulesViz和arules(按此顺序导致后者需要前者)并且它再次工作。