这是我的第一个问题,我希望它不会误导/在错误的地方。
假设我有一个完整填充的数据矩阵,除了一个值。例如,第1列是高度,第2列是权重,第3列是Bench Press。所以我调查了20个人,并得到了他们的身高,体重和卧推重量。现在我有一个体重170磅的5'11个人,并希望预测他/她的卧推重量。您可以将此视为具有缺失值的矩阵,或者您可以将其视为希望在给定自变量向量的情况下预测因变量。有这种问题的曲线拟合方法,但我想知道如何使用奇异值分解来回答这个问题。
我知道奇异值分解是一种预测缺失值的方法,但实际上我发现的所有信息都与巨大的,高度稀疏的矩阵有关,与Netflix Prize及相关问题有关。我无法弄清楚如何使用SVD或类似的方法来预测中小型,完全填充(除了一个缺失值)矩阵的缺失值。
使用SVD解决上述示例的逐步算法对我非常有帮助。谢谢!
答案 0 :(得分:0)
我计划将此作为一个评论,但它的篇幅太长,所以我已将其作为答案提交。
我对SVD的阅读告诉我,它不适用于你的例子。特别是你似乎需要以某种方式将一些难度排名分配到矩阵的卧推专栏,或者个人的某些能力等级。也许两者。由于他可以按压的数量完全取决于他自己的身高和体重,我不认为SVD会提供任何优化,而只是计算列表中其他人完成的统计平均值,并使用它来预测你的结果。 '11 170lb升降机。也许如果有BMI(体重指数)列,如果BMI可以排名......可能是更大的数据集。我认为问题在于使用SVD可以减少矩阵中的噪音。这是一个似乎使用类似问题的啧啧:http://www.puffinwarellc.com/index.php/news-and-articles/articles/30-singular-value-decomposition-tutorial.html