R:来自矩阵的Creatng DocumentTermMatrix(最初是libsvm数据)

时间:2017-10-18 18:59:17

标签: r nlp

我有以稀疏数据格式存储的术语频率数据(cols:terms,rows:documents)。

我导入并转换为矩阵,如下所示:

rawmforCluster=read.matrix.csr(".\\jobDescription\\ReducedAndJoined.libsvm")
sparseforCluster=rawmforCluster$x
sparseMatrixforCluster=as.matrix(sparseforCluster)

这会创建一个矩阵:

term1, term2, term3
1,     0,     2
2,     1,     0
0,     0,     1

(60000行和400列除外)

我需要将此矩阵转换为DocumentTermsMatrix,以便将其输入topicmodels LDA函数

ap_lda <- LDA(sparseMatrixforCluster, k = 10, control = list(seed = 1234))

注意:我可以直接输入矩阵,但在分析结果时出现以下错误:

  

整洁(ap_lda,matrix =&#34; beta&#34;)

     

mutate_impl(.data,dots)中的错误:

     

term的类型不支持NULL

0 个答案:

没有答案