sklearn SVC +稀疏数据加速

时间:2014-05-05 10:52:51

标签: python machine-learning scikit-learn data-analysis

美好的一天!

我遇到了很大麻烦,因为SVC需要花费太多时间。而且我无法对数据进行标准化,因为它是sparce,矩阵的大小对于密集表示来说太大了。我通过

缩放数据
sklearn.preprocessing.scale

但它还不够。有什么可以加快SVC的计算?

1 个答案:

答案 0 :(得分:2)

1)购买一台具有如此大量RAM的机器,您可以缓存整个克矩阵。缓存大小对LibSVM具有最大的性能影响,这是scikit学习使用的。

2)使用不同的算法。 Scikit learn已经在调用LibSVM,它可能是最快的基于SMO的SVM实现。