Python-将TF文档矩阵(稀疏)转换为值列表

时间:2019-03-19 15:32:36

标签: python pandas numpy sparse-matrix

我已经使用Scikit-learn包在我的数据集中生成了稀疏的文档和令牌矩阵。我想将其映射到以下形式的熊猫数据框:

doc_id    token    score
   1       cat      2
   1       dog      5
   1       monkey   3
   2       dog      7
   2       cat      4
   2       house    8

到目前为止,我使用的方法如下:

  • 将稀疏矩阵转换为密集矩阵
  • 将密集矩阵转换为数据框
  • 将熊猫数据框转换为字典
  • 将字典转换为上方格式

这当然是漫长的过程,虽然它适用于我的小型数据集,但不会扩展。

将稀疏矩阵转换为上述格式的最省时的方法是什么?

0 个答案:

没有答案