我正在尝试基于特征相似性进行推荐,其中我的特征空间中的点代表唯一的类。基本上我有数百个独特的项目表示为低维特征向量,我想找到新的观察的排名顺序的 k - 最近的邻居。
按照惯例,您会找到 k 邻居并选择其中包含大部分表示的类。考虑到每个项目都有自己的类,这对我的情况不起作用。
这是 k NN错误的做法吗?是否存在更适合此类问题的不同算法族?
答案 0 :(得分:1)
kNN是否是正确的方法归结为您的类是否在特征空间中以距离度量标准很好地表征。你提出的建议没有任何内在错误。您可以简单地将一个唯一的类与每个训练观察结果相关联,然后将kNN应用于k = 1
。
答案 1 :(得分:1)
听起来您想要构建recommender system,您可以根据已购买的产品推荐新产品。这不是一个分类问题,所以你不应该像对待它那样对待它。
使用什么方法实际上取决于有关数据,数量,功能表示和其他问题的更多详细信息。推荐系统往往是一个更难的问题,他们简单的分类与更细微的问题。 This coursera course可能对您更有帮助。