更新:我找到了以下C# Library,它非常适合我的需要。
=============================================== ===============
所以我有一组数据点,例如:4,5,2,3,15,3,3,5 然后我计算出上部(Q2)和下部四分位数(Q1),分别为5和3。
由于四分位数,我可以从最低数字引用到Q1,目标是低25%,然后从最高值到Q2,目标是前25%。因为我现在有Q1和Q2,所以我也可以定位内部50%的值。
有了这些信息,我希望能够确定我们90%的数据落在哪里,而且我无法在网上找到任何其他百分比超过25%的人。
如果它有帮助,我正在进行这些计算的服务器端语言是C#with .NET 4.5,但我想知道它背后的数学而不是完成它的编程方法。
非常感谢任何帮助。希望我写的内容足够清楚。
感谢。
答案 0 :(得分:2)
您具体参考数学,因此我不会包含任何代码。
要做的第一件事是构造分位数函数的结(这是x轴上的概率和y轴上的值的图)。通过对值进行排序(在您的情况下为此表)来执行此操作:
Probability Value
1/8 2
4/8 3
5/8 4
7/8 5
8/8 15
然后构造一个单调三次样条插值器,它通过这些点。你使用montotone三次样条,因为(1)分位数函数永远不会有负斜率和(2)它必须连续到至少一阶(因为分位数函数的一阶导数的倒数是概率密度函数)
然后,您可以使用插值器查找其他值。例如查找90%插值器值,得出你有90%机会获得的结果。
当然,结之间的中间值是从数据推断的,是近似值。