我是Python的新手,我正在尝试将矩阵中的数据写入CSV文件。变量定义为:
(Pdb) trainFeatures
<1562936x312116 sparse matrix of type '<type 'numpy.float64'>'
with 43753231 stored elements in Compressed Sparse Row format>
我有一行代码:
numpy.savetxt("feature_train.csv", trainFeatures, delimiter=',')
当我运行该行时,收到错误消息:
ncol = X.shape[1]
IndexError: tuple index out of range
我确定矩阵在某种程度上不是正确的格式,但我不知道怎么做到这一点。任何人都可以指出我需要做什么吗?
答案 0 :(得分:2)
好的,要完成此过程,原始问题的答案是使用todense()方法将trainFeatures转换为savetxt()识别的格式。但是为了进一步评论缺少内存,显而易见的解决方案是使用getrow()方法并遍历所有行并将每一行写入文件,而不是一次性尝试完成整个矩阵。