数据挖掘方法有哪些区别:推荐系统领域中的频繁项目集和基于项目的协同过滤?
答案 0 :(得分:0)
频繁项目集只使用一元数据:我们知道一个人在她的篮子里有某些物品,但我们不知道她是否知道宇宙中存在其他物品。也就是说,她没有在她的篮子里放置Z项,因为她知道它并不喜欢它,或者因为她不知道它(并且如果她这样做可能包含它)。
另一方面,基于项目的协同过滤通常包括评级数据。例如,星级评定为0.5至5.0(在MovieLens的情况下)。在这里,我们可以更好地计算项目之间的相似性,因为我们既有正面意见又有负面意见,我们可以做出更明智的猜测,即如果用户没有对某个项目进行评分,她就不知道它存在。