应用错误收集

在sklearn线性模型中使用预先计算的Gram矩阵（Lasso，Lars等）

时间：2015-01-19 12:00:39

标签： python machine-learning scikit-learn

我正在尝试在非常大的数据集上训练线性模型。特征空间很小，但内存中的样本太多。我正在计算Gram矩阵并试图将其作为参数传递给sklearn Lasso（或其他算法）但是，当我称之为fit时，它需要实际的X和y矩阵。

知道如何在不存储原始矩阵的情况下使用“预计算”功能吗？

1 个答案:

答案 0 :(得分：0)

（我的回答是基于svm.SVC的用法，Lasso可能会有所不同。）

我认为你应该将Gram矩阵而不是X传递给fit方法。

此外，Gram矩阵具有形状（n_samples，n_samples），因此在你的情况下它也应该对于内存来说太大了，对吗？