我已经使用Scikit-learn包在我的数据集中生成了稀疏的文档和令牌矩阵。我想将其映射到以下形式的熊猫数据框:
doc_id token score
1 cat 2
1 dog 5
1 monkey 3
2 dog 7
2 cat 4
2 house 8
到目前为止,我使用的方法如下:
这当然是漫长的过程,虽然它适用于我的小型数据集,但不会扩展。
将稀疏矩阵转换为上述格式的最省时的方法是什么?