无法将稀疏矩阵写入csv

时间:2014-08-05 02:03:07

标签: python python-2.7 csv numpy export-to-csv

我是Python的新手,我正在尝试将矩阵中的数据写入CSV文件。变量定义为:

(Pdb) trainFeatures
<1562936x312116 sparse matrix of type '<type 'numpy.float64'>'
with 43753231 stored elements in Compressed Sparse Row format>

我有一行代码:

numpy.savetxt("feature_train.csv", trainFeatures, delimiter=',')

当我运行该行时,收到错误消息:

ncol = X.shape[1]
IndexError: tuple index out of range

我确定矩阵在某种程度上不是正确的格式,但我不知道怎么做到这一点。任何人都可以指出我需要做什么吗?

1 个答案:

答案 0 :(得分:2)

好的,要完成此过程,原始问题的答案是使用todense()方法将trainFeatures转换为savetxt()识别的格式。但是为了进一步评论缺少内存,显而易见的解决方案是使用getrow()方法并遍历所有行并将每一行写入文件,而不是一次性尝试完成整个矩阵。