基于内容的过滤(CBF):该功能基于产品/商品属性。假设user_1过去已对某些商品下了订单(或喜欢)。 现在,我们需要确定这些订购商品的相关功能,并将其与其他商品进行比较以推荐任何新商品。 基于特征集查找相似项的著名模型之一是随机森林或决策树
协作过滤(CLF):它使用用户行为。假设user_1过去已对某些商品下了订单(或喜欢)。现在我们找到类似的用户。用户数 过去订购/喜欢相同商品的用户可以视为相似用户。现在,我们可以根据分数推荐相似用户订购的一些商品。 查找相似用户的著名模型之一是KNN
问题::说我必须不是基于他们在CBF中的行为(就像我提到的那样)而是基于一些用户配置文件功能来找到相似的用户 国籍/身高/体重/语言/薪水等会被视为CBF或CLF吗?
与我相关的第二个疑问是CBF或CLF都不适用于系统中的新用户,因为他没有在系统中进行任何活动。那是对的吗 ?相同 是系统是新的还是已启动的情况是什么,因为我们在这里没有太多数据?
答案 0 :(得分:0)
您可以将基于内容的方法视为回归问题,其中将x_i作为数据点,并将其相应的y_i作为用户给出的等级。 您已经正确说明了CLF,它使用用户项目矩阵从中创建项目项目或用户用户矩阵,然后根据这些矩阵推荐产品/项目。
但是在基于内容的情况下,您需要构建一个与每个用户相对应的向量。例如假设我们要为netflix用户创建一个向量。此向量可以包括诸如该用户观看过多少电影,他/她喜欢的电影种类,他是关键用户等特征。您提到的某些特征(例如他的平均工资和其他),该向量将具有y_i将其评级。这些推荐系统称为基于内容的系统,它可以回答您的第一个问题。
谈到第二个问题,即当一个新用户/项目进入图片时,一个人如何向该用户推荐项目。此问题称为冷启动问题。在这种情况下,您可以使用该用户的地理位置来选择该国人民观看的热门商品,并根据这些内容进行推荐。他开始对这些热门项目进行评分后,您的CLF和基于内容的内容都可以正常运行。