使用密集训练数据预测稀疏测试SVD的数据会导致性能不佳

时间:2015-08-04 19:10:02

标签: machine-learning nlp svd collaborative-filtering

我正在使用SVD实现协同过滤(如netflix),我遇到的问题是我的训练数据相对于测试集非常密集。该算法不会返回大多数测试数据的建议。有关如何解决此问题的任何建议吗?

为了使这个更具体,训练数据包含长文档(维基百科),但测试数据只有一个或两个非零条目(用户编写的短语)。

0 个答案:

没有答案