建立排名/评分系统的数学模型

时间:2016-01-04 10:05:20

标签: math machine-learning mathematical-optimization stat

我想对一组卖家进行排名。每个卖方由参数var1,var2,var3,var4 ... var20定义。我想给每个卖家打分。

目前我通过为这些参数指定权重来计算得分(对var1说10%,对var2说20%等等),这些权重是根据我的直觉确定的。

我的得分方程式如下

score = w1* var1 +w2* var2+...+w20*var20
score  = 0.1*var1+ 0.5 *var2 + .05*var3+........+0.0001*var20

我的得分方程也可能看起来像

score = w1^2* var1 +w2* var2+...+w20^5*var20

其中var1,var2,.. var20被规范化。

我应该使用哪个等式? 有哪些方法可以科学地确定,分配什么权重

我想优化这些权重,使用一些面向数据的方法来改进评分机制,以获得更相关的分数。

例如

我为卖家提供以下功能

1]订单履行率[数字]

2]订单取消率[数字]

3]用户评分[1-5] {1-2:最差,3:平均,5:好} [分类]

4]确认订单所需的时间。 (卖家所用时间越短越好)[数字]

5]价格竞争力

是否有更好的算法/方法来解决这个问题?计算得分?即我线性地添加了各种功能,我想知道建立排名系统的更好方法吗?

如何获得权重值?

除了使用上述功能之外,我能想到的更多是正面评价与负面评论的比率,受损商品的比率等。这些如何符合我的评分等式?

1 个答案:

答案 0 :(得分:1)

不幸的是,stackoverflow没有乳胶所以图像必须这样做:

同样作为免责声明,我不认为这是一个简明的答案,但你的问题相当广泛。这还没有经过测试,但考虑到类似的问题,我很可能采取的方法。

作为可能的方向,下面是multivariate gaussian。这个想法是每个参数都在它自己的维度,因此可以按重要性加权。例如:

Sigma = [1,0,0;0,2,0;0,0,3] for a vector [x1,x2,x3] the x1 would have the greatest importance.
  1. 协方差矩阵Sigma负责每个维度的缩放。为了实现这一点,只需将权重加到对角矩阵nxn到对角元素。你并不真正关心交叉术语。
  2. Mu是您的卖家数据中所有日志的平均值,是一个向量。
  3. x是特定卖家的每个类别的平均值,并且是向量x = {x1,x2,x3...,xn}。随着收集的数据越来越多,这是一个不断更新的值。
  4. 基于总数据集的函数参数也应该发展。这种方式偏向投票,特别是在"感情"基础类别可以淘汰。
  5. enter image description here

    在该设置之后,可以使用函数f_x的评估来给出期望的结果。这是概率密度函数,但其​​效用不限于统计。