我有以稀疏数据格式存储的术语频率数据(cols:terms,rows:documents)。
我导入并转换为矩阵,如下所示:
rawmforCluster=read.matrix.csr(".\\jobDescription\\ReducedAndJoined.libsvm")
sparseforCluster=rawmforCluster$x
sparseMatrixforCluster=as.matrix(sparseforCluster)
这会创建一个矩阵:
term1, term2, term3
1, 0, 2
2, 1, 0
0, 0, 1
(60000行和400列除外)
我需要将此矩阵转换为DocumentTermsMatrix,以便将其输入topicmodels LDA函数
ap_lda <- LDA(sparseMatrixforCluster, k = 10, control = list(seed = 1234))
注意:我可以直接输入矩阵,但在分析结果时出现以下错误:
整洁(ap_lda,matrix =&#34; beta&#34;)
mutate_impl(.data,dots)中的错误:
列
term
的类型不支持NULL