我想将sklearn.feature_extraction.text中的TfidfVectorizer的结果保存到文本文件中以备将来使用。正如我发现的那样,它是一个''类型的稀疏矩阵。但是当我尝试使用以下代码保存它时
np.savetxt('Feature_TfIdf.txt', X_Tfidf, fmt='%2.6f')
我收到这样的错误
IndexError: tuple index out of range
答案 0 :(得分:1)
使用joblib.dump
或sklearn.externals.joblib.dump
。 NumPy没有得到SciPy稀疏矩阵。
答案 1 :(得分:0)
我设法通过将稀疏矩阵转换为全矩阵来解决问题,然后保存矩阵并保存结果。然而,这种方法对于大型数组没有用,因此最好以.pkl格式保存矩阵。
答案 2 :(得分:0)
简单的例子:
np.save('TfIdf.pkl',tfidf)