我使用相同的数据集在text2vec中创建了一个tf-idf DTM和一个基于n-gram的DTM。现在,我可以分别在每个上运行glmnet,但是当我将这两个DTM组合到cBind时,glmnet给了我一个错误:
Error in validObject(.Object) :invalid class “dgCMatrix” object: length(Dimnames[1]) differs from Dim[1] which is 43895
dtm_train_tfidf =(19579 * 27511)矩阵,
dtm_train_ngram =(19579 * 16384)矩阵。
这意味着它们具有相同的确切行数,并且我可以使用cBind(cbind for matrices)组合它们并获得一个大型矩阵,我应该能够运行glmnet。 只有我无法运行它,我得到这个错误。 我该怎么纠正?
答案 0 :(得分:1)
这是由于错误https://github.com/dselivanov/text2vec/issues/205造成的。您可以使用GitHub中的开发版本,或者只从哈希矢量图中删除dtm的colnames。