我遇到了一个NLP问题,我试图使用矢量化文本来显示工程师虚拟列。
我有一个名为“ descriptions_test”的scipy.sparse.csr.csr.matrix
descriptions_test.shape
(54504, 19574)
我知道它具有获得虚拟列的形状,但是当我运行时
dummy_description = pd.get_dummies(descriptions_test)
我收到此TypeError
TypeError: sparse matrix length is ambiguous; use getnnz() or shape[0]
是否可以快速解决,还是需要将scipy矩阵转换为DataFrame?