从累积分布函数计算分布中位数

时间:2020-07-17 21:30:53

标签: python numpy scipy statistics

我的密度函数定义如下:

def f(x):
   if 0<=x<=1:
      return 0.5
   elif 1<x<=3:
      return 0.25
   else:
      return 0.0

我矢量化了密度函数:

f = np.vectorize(f)

然后我定义了X数组

X = np.arange(-10,10,0.001)

最后,CDF:

def CDF(x):
   return quad(f, -np.inf,x)
CDF = np.vectorize(CDF)
CDF_calculated,err=CDF(X)

现在我要计算

median = np.round(X[np.where(CDF_calculated==0.5)][0])

我在这里写的正确吗?

1 个答案:

答案 0 :(得分:1)

如果函数是先验的,我将使用其分析积分。 对于中位数计算,我将使用类似二等分法(因为函数不平滑)

import numpy as np
from scipy.optimize import bisect

def f(x):
   if 0<=x<=1:
      return 0.5
   elif 1<x<=3:
      return 0.25
   else:
      return 0.0

  
def cdf(x):
    if 0<=x<=1:
        return 0.5*x
    elif 1<x<=3:
        return 0.5 + 0.25*(x-1)
    elif x<0:
        return 0.0
    else:
        return 1


f = np.vectorize(f)
cdf = np.vectorize(cdf)

fbisect = lambda v: cdf(v) - 0.5

median = bisect(fbisect,0,3)
print(median)