错误在text2vec中的2个组合DTM(通过cBind)上运行glmnet

时间:2017-12-14 16:59:02

标签: r text2vec

我使用相同的数据集在text2vec中创建了一个tf-idf DTM和一个基于n-gram的DTM。现在,我可以分别在每个上运行glmnet,但是当我将这两个DTM组合到cBind时,glmnet给了我一个错误:

Error in validObject(.Object) :invalid class “dgCMatrix” object: length(Dimnames[1]) differs from Dim[1] which is 43895

dtm_train_tfidf =(19579 * 27511)矩阵,

dtm_train_ngram =(19579 * 16384)矩阵。

这意味着它们具有相同的确切行数,并且我可以使用cBind(cbind for matrices)组合它们并获得一个大型矩阵,我应该能够运行glmnet。 只有我无法运行它,我得到这个错误。 我该怎么纠正?

1 个答案:

答案 0 :(得分:1)

这是由于错误https://github.com/dselivanov/text2vec/issues/205造成的。您可以使用GitHub中的开发版本,或者只从哈希矢量图中删除dtm的colnames。