DocumentTermMatrix()在tm包中返回0个术语

时间:2015-08-11 02:46:23

标签: r tm lda topicmodels

我有一个像这样的对象:

str(apps)
 chr [1:17517] "35 44 33 40 33 40 44 38 33 37 37" ...

在每一行中,数字用空格分隔。

corpus<-Corpus(VectorSource(apps))
dtm<-DocumentTermMatrix(corpus)
str(dtm)
List of 6
 $ i       : int(0) 
 $ j       : int(0) 
 $ v       : num(0) 
 $ nrow    : int 17517
 $ ncol    : int 0
 $ dimnames:List of 2
  ..$ Docs : chr [1:17517] "1" "2" "3" "4" ...
  ..$ Terms: NULL
 - attr(*, "class")= chr [1:2] "DocumentTermMatrix" "simple_triplet_matrix"
 - attr(*, "weighting")= chr [1:2] "term frequency" "tf"

我发现这些条款是NULL。我不确切知道DocumentTermMatrix()的数据结构,我只是关注这个帖子Document-Term-Matrix of tm Package in R。有人可以帮忙解决吗?感谢

0 个答案:

没有答案