将dgcMatrix转换为datatable

时间:2017-10-12 09:33:46

标签: r

我正在尝试使用以下代码将dgcMatrix转换为R中的数据表:

feats <- as.data.table(as.matrix(dtm_text))

但它会抛出这样的错误:

Error in nchar(collabs) : invalid multibyte string, element 149

有没有人有这个错误的原因或其他方法来达到同样的目的?

问题行之前的一小部分代码

bow <- itoken(trte_data$Description, preprocessor = tolower ,tokenizer = 
word_tokenizer, ids = trte_data$User_ID)
bow_vocab <- create_vocabulary(bow)
pruned_bow <- prune_vocabulary(bow_vocab, term_count_min = 100)
vovec <- vocab_vectorizer(pruned_bow)
dtm_text <- create_dtm(bow, vovec)

0 个答案:

没有答案