Azure机器学习有一个名为Train Matchbox Recommender
的项目。它可以配置Number of traits
。不幸的是,文档没有描述这样的特征是什么。
什么是特质?这与latent variables相关吗?
答案 0 :(得分:1)
This页面可能有更好的描述。
基本上,特征是算法将了解与每个项目相关的每个用户的特征。例如,在restaurant ratings recommender中,特征可以包括用户的出生年份,如果他们是学生或工作专业人员,则具有军事地位等。
希望有所帮助!
答案 1 :(得分:0)
我认为是的,这与潜在变量有关,并且定义了压缩特征矩阵的维数。该矩阵的列-潜在特征向量-可以解释为用户的刻板印象。因此,number of traits
与推荐模型中的原型用户数量相对应。
您可以在相应的研究论文"Matchbox: Large Scale Bayesian Recommendations"中找到更多解释:
用户和商品由特征向量表示,特征向量映射到低维“特征空间”,其中根据内积(source)来衡量相似性。
在经典协作过滤中,通常通过最小二乘法使用奇异值分解(SVD)并仅选择此矩阵的前k个/最大k维来计算此潜在表示。这降低了用户项目评分矩阵的维数。在此Hacker Noon article by Steeve Huang中,您可以找到更详细的说明。
更新1:添加了对潜在向量的解释