我想对一组卖家进行排名。每个卖方由参数var1,var2,var3,var4 ... var20定义。我想给每个卖家打分。
目前我通过为这些参数指定权重来计算得分(对var1说10%,对var2说20%等等),这些权重是根据我的直觉确定的。
我的得分方程式如下
score = w1* var1 +w2* var2+...+w20*var20
score = 0.1*var1+ 0.5 *var2 + .05*var3+........+0.0001*var20
我的得分方程也可能看起来像
score = w1^2* var1 +w2* var2+...+w20^5*var20
其中var1,var2,.. var20被规范化。
我应该使用哪个等式? 有哪些方法可以科学地确定,分配什么权重?
我想优化这些权重,使用一些面向数据的方法来改进评分机制,以获得更相关的分数。
我为卖家提供以下功能
1]订单履行率[数字]
2]订单取消率[数字]
3]用户评分[1-5] {1-2:最差,3:平均,5:好} [分类]
4]确认订单所需的时间。 (卖家所用时间越短越好)[数字]
5]价格竞争力
是否有更好的算法/方法来解决这个问题?计算得分?即我线性地添加了各种功能,我想知道建立排名系统的更好方法吗?
如何获得权重值?
除了使用上述功能之外,我能想到的更多是正面评价与负面评论的比率,受损商品的比率等。这些如何符合我的评分等式?
答案 0 :(得分:1)
不幸的是,stackoverflow没有乳胶所以图像必须这样做:
同样作为免责声明,我不认为这是一个简明的答案,但你的问题相当广泛。这还没有经过测试,但考虑到类似的问题,我很可能采取的方法。
作为可能的方向,下面是multivariate gaussian
。这个想法是每个参数都在它自己的维度,因此可以按重要性加权。例如:
Sigma = [1,0,0;0,2,0;0,0,3] for a vector [x1,x2,x3] the x1 would have the greatest importance.