我正在关注有关使用奇异值分解(SVD)的Python电影推荐中的矩阵分解的教程: here
使用 SVD ,使用SVD将数据集近似为三个分量:
MainThread
现在,我想在此矩阵上使用训练/测试验证集,因为您需要找到M的最佳k(数字)近似值。
如何将一个单独的测试集应用到经过训练的模型上,以获得对看不见的测试集的预测? 数学/算法是什么? 谢谢
答案 0 :(得分:1)
适合任何机器学习模型的标准过程如下:
因此,您应执行以下步骤:
train_test_split
k
值运行SVD,并在验证集上评估这些近似值的性能,然后选择具有最低RMSE值的k
(如本教程所述)如果您的数据集较小,而不是拆分为3个数据集,则可以拆分以进行训练和测试,并使用cross validation来微调k
。