标签: r matrix memory text-mining tm
我有一个大文档术语矩阵(42 Mb)。
当我将其转换为矩阵时,它会使计算机内存不足。 我想将它转换为稀疏矩阵而不是矩阵。 这就是我现在正在使用的内容:
M <- as.matrix(dtm)
文本挖掘的包是“tm”。 目前我正试图将数据集分成两个块来转换它们并重新组装它们。
干杯,
的Dario。