我正在尝试在非常大的数据集上训练线性模型。 特征空间很小,但内存中的样本太多。 我正在计算Gram矩阵并试图将其作为参数传递给sklearn Lasso(或其他算法)但是,当我称之为fit时,它需要实际的X和y矩阵。
知道如何在不存储原始矩阵的情况下使用“预计算”功能吗?
答案 0 :(得分:0)
(我的回答是基于svm.SVC的用法,Lasso可能会有所不同。)
我认为你应该将Gram矩阵而不是X传递给fit方法。
此外,Gram矩阵具有形状(n_samples,n_samples),因此在你的情况下它也应该对于内存来说太大了,对吗?