将numpy稀疏矩阵保存到文件中

时间:2014-07-04 04:53:23

标签: numpy save scikit-learn sparse-matrix

我想将sklearn.feature_extraction.text中的TfidfVectorizer的结果保存到文本文件中以备将来使用。正如我发现的那样,它是一个''类型的稀疏矩阵。但是当我尝试使用以下代码保存它时

np.savetxt('Feature_TfIdf.txt', X_Tfidf, fmt='%2.6f')

我收到这样的错误

IndexError: tuple index out of range

3 个答案:

答案 0 :(得分:1)

使用joblib.dumpsklearn.externals.joblib.dump。 NumPy没有得到SciPy稀疏矩阵。

答案 1 :(得分:0)

我设法通过将稀疏矩阵转换为全矩阵来解决问题,然后保存矩阵并保存结果。然而,这种方法对于大型数组没有用,因此最好以.pkl格式保存矩阵。

答案 2 :(得分:0)

简单的例子:

np.save('TfIdf.pkl',tfidf)