根据R Studio,我有一个DocumentTermMatrix对象,它的大小为196.3 Mb。我正在尝试将其转换为矩阵,并收到以下错误:
kaggle_corpus <- VCorpus(kaggle_source)
kaggle_dtm <- DocumentTermMatrix(kaggle_corpus_clean)
kaggle_matrix <- as.matrix(kaggle_dtm)
Error: cannot allocate vector of size 616.9 Gb
语料库为3.7Gb,而DTM如前所述为196.3Mb。当然,我可以在创建矩阵之前为语料库预先分配空间并释放它。我怀疑我能否在16Gb笔记本电脑上释放600Gb:)
任何人都知道为什么R需要619Gb才能从196Mb dtm创建矩阵?每次我运行命令时,它需要619Gb,因此它似乎不是一个随机数。