LSA之后的RTextTools

时间:2016-08-05 12:53:29

标签: r data-mining text-mining sentiment-analysis text-classification

我在R中使用LSA库并在lsa投影后创建TermDocumentMatrix。但是对于使用我的TermDocumentMatrix的RTextTools库进行分类,它会出现以下错误:

container <- create_container(t(projected_train_matrix), givenData$sentiment, trainSize=1:20000, testSize=20001:25000,virgin=FALSE)

投影矩阵很好,但它会出现以下错误

validObject(.Object)中的错误:   无效的类“matrix_container”对象:插槽的无效对象&#34; column_names&#34;在课堂上&#34; matrix_container&#34;:得到了课程&#34; NULL&#34;,应该是或者扩展课程&#34; vector&#34;

在使用仅由RtextTools函数创建的TermDocumentMtarix时,它不会给出任何错误。

Rtextmatrix <- create_matrix(givenData$review, language="english", ngramLength=1,removeNumbers=TRUE,removePunctuation=TRUE,removeSparseTerms=0,removeStopwords=TRUE,stemWords=FALSE,stripWhitespace=TRUE,toLower=TRUE,weighting=tm::weightTf)

但是我确实需要进行LSA处理。所以任何人都可以建议我能做些什么来克服这个错误。

0 个答案:

没有答案