如何从稀疏csr_matrix获取伪列

时间:2019-06-18 05:26:51

标签: python scipy sklearn-pandas natural-language-processing

我遇到了一个N​​LP问题,我试图使用矢量化文本来显示工程师虚拟列。

我有一个名为“ descriptions_test”的scipy.sparse.csr.csr.matrix

descriptions_test.shape
(54504, 19574)

我知道它具有获得虚拟列的形状,但是当我运行时

dummy_description = pd.get_dummies(descriptions_test)

我收到此TypeError TypeError: sparse matrix length is ambiguous; use getnnz() or shape[0]

是否可以快速解决,还是需要将scipy矩阵转换为DataFrame?

0 个答案:

没有答案