我无法弄清楚如何设定一组记录的估计最高价格。
我想避免的是简单地使用SQL MAX,因为可能存在价格过高的记录。
例如,在OLX的“计算机硬件”类别(http://www.olx.com/computers-hardware-cat-240)中,最高价格的过滤器估计设置为1400美元,但按价格排序,第一项超过10000美元
也许他们计算了平均值然后估算了一些最高价格......您怎么看?
答案 0 :(得分:3)
如果您假设价格的正态(高斯)分布,您可以使用此公式估算最大值
avg(price) + 3*stddev(price)
如果分布确实是高斯分布,大约95%的样本应该包含在[avg - 3 * stddev; avg + 3 * stddev]
答案 1 :(得分:0)
那你要求的是什么?计算机做他们确切要求做的事情。查看统计函数 - 中位数等(http://en.wikipedia.org/wiki/Median)