使用自然稀疏数据我很乐意使用scipy稀疏类型(例如 csr_matrix )。但是当我看到各种分类器是否真的支持这种类型时,我感到很困惑!
第二个问题是关于使用稀疏类型(appart for memory storage)的优点:它是否提高了算法的速度?对于svm.SVC看起来并不是这样,但我无法确定,你对这个问题了解得更多吗?
我必须补充一点,我计划使用 cross_val_score 和 GreadSearchCV 对这些稀疏数据进行调整和交叉验证,并且希望确保这些函数可以有效地支持这种稀疏类型。
谢谢大家的帮助!