应用错误收集

使用密集训练数据预测稀疏测试SVD的数据会导致性能不佳

时间：2015-08-04 19:10:02

标签： machine-learning nlp svd collaborative-filtering

我正在使用SVD实现协同过滤（如netflix），我遇到的问题是我的训练数据相对于测试集非常密集。该算法不会返回大多数测试数据的建议。有关如何解决此问题的任何建议吗？

为了使这个更具体，训练数据包含长文档（维基百科），但测试数据只有一个或两个非零条目（用户编写的短语）。

0 个答案:

没有答案