标签: machine-learning nlp svd collaborative-filtering
我正在使用SVD实现协同过滤(如netflix),我遇到的问题是我的训练数据相对于测试集非常密集。该算法不会返回大多数测试数据的建议。有关如何解决此问题的任何建议吗?
为了使这个更具体,训练数据包含长文档(维基百科),但测试数据只有一个或两个非零条目(用户编写的短语)。