在sklearn线性模型中使用预先计算的Gram矩阵(Lasso,Lars等)

时间:2015-01-19 12:00:39

标签: python machine-learning scikit-learn

我正在尝试在非常大的数据集上训练线性模型。 特征空间很小,但内存中的样本太多。 我正在计算Gram矩阵并试图将其作为参数传递给sklearn Lasso(或其他算法)但是,当我称之为fit时,它需要实际的X和y矩阵。

知道如何在不存储原始矩阵的情况下使用“预计算”功能吗?

1 个答案:

答案 0 :(得分:0)

(我的回答是基于svm.SVC的用法,Lasso可能会有所不同。)

我认为你应该将Gram矩阵而不是X传递给fit方法。

此外,Gram矩阵具有形状(n_samples,n_samples),因此在你的情况下它也应该对于内存来说太大了,对吗?