我想根据过去的事件列表计算百分比概率 数据看起来与此简化表类似,例如,当过去的第一个值为8时,事件发生的可能性为72%。
1 76%
2 64%
4 80%
6 85%
7 83%
8 72%
11 70%
完整表的范围为0到1030,有377行,但每天都会更改。我希望传递函数一个值如3并返回事件发生的百分比概率。我不需要确切的代码,但是会喜欢指向正确的方向。 感谢
答案 0 :(得分:0)
根据您在问题评论中的答案,我建议进行插值---线性插值是最简单的答案。根据电子表格中的系列,概率模型看起来不合适(第1列和第3列之间似乎没有明确的关系)。
举一个例子说明这是如何工作的:假设你想要某个点p的概率,这在数据中是未被观察到的。你观察到的最大值小于而不是p是p_low(具有相应的概率f(p_low)),并且大于p的最小值是p_high(具有概率f(p_high))。您对p的估计是:
interval = p_high - p_low
f_p_hat = ((p-p_low)/interval*f_p_low) + ((p_high-p)/interval*f_p_high)
这将使你对p_low和p_high值的加权平均值进行估计,权重由p和p_low,p和p_high之间的距离给出。例如。如果p在p_low和p_high之间是等距的,那么f_p_hat(你对f(p)的估计)就是p_low和p_high的平均值。
现在,如果您有理由怀疑端点处的估计值不准确(可能是由于样本量较小),则线性插值可能不起作用。如果是这样,则可以对p周围的点邻域进行(可能加权的)最小二乘拟合,并将其用作预测。如果是这种情况,我可以进一步了解一下。