Document-Term-Matrix和K-Means

时间:2018-03-08 09:43:43

标签: r text text-mining

我遇到了文档术语矩阵的问题,我尝试执行k-means以及将来的其他算法。

str(dtm) leads to:

Formal class 'dgCMatrix' [package "Matrix"] with 6 slots
  ..@ i       : int [1:833268] 433447 439341 443574 449522 453531 465226 
466884 
473543 487479 489550 ...
..@ p       : int [1:4554] 0 10 20 30 40 50 60 70 80 90 ...
..@ Dim     : int [1:2] 820388 4553
..@ Dimnames:List of 2
.. ..$ : chr [1:820388] "1" "2" "3" "4" ...
.. ..$ : chr [1:4553] "m dvi d" "kramer industrie und" " miete carl" "jobag 
business service" ...
..@ x       : num [1:833268] 1 1 1 1 1 1 1 1 1 1 ...
..@ factors : list()  


dim(dtm)
[1] 820388   4553  


kmeans5 <- kmeans(dtm, 5)

如果我尝试在此dtm上执行kmeans,则会出现此问题 &#34; asMethod(对象)出错:   Cholmod-Fehler问题太大了&#39; bei Datei ../Core/cholmod_dense.c,Zeile 105&#34;

由于我是编程新手,我不确定该怎么做。 如果需要更多信息,请写信给我。 谢谢

0 个答案:

没有答案