浏览一些关于协同过滤的教程,我发现它主要用于电影和图书推荐,数据集包含用户及其评价的项目。当然,每个项目的评级范围是相同的(例如1-10)。但是如果我有一个具有不同范围的数据集呢?这意味着一个完全不同的数据集,与人们如何评价项目无关,而是基于人们的医疗记录。我正在考虑将记录中的功能(如BMI,体重,身高等)用作项和用户作为该记录的人。基本上在过程结束时,我想基于已经具有预定输出的其他记录来确定是否患有疾病。我知道这通常可以很容易地在神经网络中完成。但我真的想知道协作过滤是否也有可能。或者不是吗?
答案 0 :(得分:3)
不推荐问题,这是经典分类,仅此而已。神经网络只是众多可能的方法之一,但再一次 - 它是不协同过滤,它正是分类的定义方式。在协同过滤中,您不知道正确的答案(标签/输出) - 您只是尝试找到一些常见的模式。在疾病检测/预测的情况下,您确切知道应该输出什么。
如果你有非常广泛的可能的,相关的疾病,以及非常少量的人(因此不可能为分析实际建立训练集),可以在这里使用推荐系统。那么寻找潜在健康问题的这种“推荐”将是有意义的。在标记的二进制输出数据的情况下,它仅仅是分类。尽管如此,你可能最终会得到一个模型:“如果你有可靠性,那么你可能会受到心脏病发作”等等。因此找到类似诊断之间的相关性。