Question

我想根据过去的事件列表计算百分比概率数据看起来与此简化表类似，例如，当过去的第一个值为8时，事件发生的可能性为72％。

完整表的范围为0到1030，有377行，但每天都会更改。我希望传递函数一个值如3并返回事件发生的百分比概率。我不需要确切的代码，但是会喜欢指向正确的方向。感谢

Answer 1

根据您在问题评论中的答案，我建议进行插值---线性插值是最简单的答案。根据电子表格中的系列，概率模型看起来不合适（第1列和第3列之间似乎没有明确的关系）。

举一个例子说明这是如何工作的：假设你想要某个点p的概率，这在数据中是未被观察到的。你观察到的最大值小于而不是p是p_low（具有相应的概率f（p_low）），并且大于p的最小值是p_high（具有概率f（p_high））。您对p的估计是：

interval = p_high - p_low
f_p_hat = ((p-p_low)/interval*f_p_low) + ((p_high-p)/interval*f_p_high)

这将使你对p_low和p_high值的加权平均值进行估计，权重由p和p_low，p和p_high之间的距离给出。例如。如果p在p_low和p_high之间是等距的，那么f_p_hat（你对f（p）的估计）就是p_low和p_high的平均值。

现在，如果您有理由怀疑端点处的估计值不准确（可能是由于样本量较小），则线性插值可能不起作用。如果是这样，则可以对p周围的点邻域进行（可能加权的）最小二乘拟合，并将其用作预测。如果是这种情况，我可以进一步了解一下。