在mahout中,我正在设置一个GenericUserBasedRecommender,现在非常简单,典型的设置。
在为项目生成“首选项”值时,我们有以下5个数据点:
积极的兴趣
负面兴趣
在我应该表达这些不同属性的范围内,让我们使用1-100比例进行讨论?
我知道最终的答案在于试验和错误以及我们数据的意义,但就算法而言,我试图理解我需要在什么时候提示兴趣和不感兴趣之间的尺度。算法正常运行。
答案 0 :(得分:3)
实际范围无关紧要,不适用于此实施。 1-100没关系,0-1可以,等等。这里的相对值非常重要。
这些值通过简单(线性)加权平均值估算。因此,响应应该是“线性的”。如果行动X的得分比行动Y高2倍,那么它应该与直觉相匹配,那么X应该是现实生活中两倍兴趣的指标。
一个体面的起点是简单地根据频率调整它们的大小。如果点击转化率为2%,您可能会获得价值2%转化的点击次数。
我会忽略你提出的“无差异”信号。使用它可能太吵了。