按两列排序 - 使用最高评级平均值和最高评级

时间:2014-03-18 03:04:13

标签: php mysql sql sql-order-by rating-system

我想显示最高平均评分(rating_avg)和评分数(rating_count)。使用我当前的脚本,它显示了最高的平均评级(DESC),无论有多少评级,这对我的访问者来说都是无用的。

例如它显示:

  1. 第1项 - 5.0(1个评级)
  2. 第2项 - 5.0(2个评级)
  3. 当它应该通过评级平均值和评级数量来显示评分最高的10个项目时,例如:

    1. 第1 - 4.5(356个评级)
    2. 第2 - 4.3(200个评级)
    3. 第3 - 4.0(400个评级)
    4. 这就是我现在所拥有的:

      $result = mysql_query("SELECT id, filename, filenamedisplay, console_dir, downloads, rating_avg, rating_count FROM files WHERE console_dir = '".$nodash."' ORDER BY rating_avg DESC LIMIT 10");
      

      谢谢,我提前感谢任何帮助!

1 个答案:

答案 0 :(得分:3)

这是一个微妙的问题,也是统计数据中的一个问题。我所做的通常是将评级降级一个标准误差。这些并不完全是比例,但我认为可以应用相同的想法。

您可以使用“p * q除以n的平方根”方法计算出来。如果你不明白这一点,请谷歌“比例的标准错误”(或者我可能会建议“使用SQL和Excel进行数据分析”中的第三章更详细地说明这一点):

SELECT id, filename, filenamedisplay, console_dir, downloads, rating_avg, rating_count
FROM files cross join
     (select count(*) as cnt from files where console_dir = '".$nodash."') as const
WHERE console_dir = '".$nodash."'
ORDER BY rating_avg/5 - sqrt((rating_avg/5) * (1 - rating_avg/5) / const.cnt) DESC
LIMIT 10;

在任何情况下,请查看该公式是否适合您。

编辑:

好的,我们将其更改为均值的标准误差。我应该第一次这样做,但我认为rating_avg是一个比例。公式是标准偏差除以样本大小的平方根。我们可以在const子查询中获得总体标准偏差:

     (select count(*) as cnt, stdev(rating_avg) as std from files where console_dir = '".$nodash."') as const

这导致:

order by rating_avg - std / sqrt(const.cnt)

这可能有效,但我宁愿在每个组中有标准偏差而不是整体人口标准偏差。但是,它会将评级降低一个与样本大小成比例的量,这可以改善您的结果。

顺便说一下,删除一个标准偏差的想法是相当随意的。我刚刚发现它产生了合理的结果。您可能更愿意采用标准偏差的1.96倍来获得置信区间的95%下限。