我正在寻找Numpy或Scipy(或任何严格的Python库)中的函数,它将为我提供Python中的累积正态分布函数。
答案 0 :(得分:111)
以下是一个例子:
>>> from scipy.stats import norm
>>> norm.cdf(1.96)
0.9750021048517795
>>> norm.cdf(-1.96)
0.024997895148220435
换句话说,大约95%的标准正常区间位于两个标准偏差内,以标准均值为零。
如果您需要逆CDF:
>>> norm.ppf(norm.cdf(1.96))
array(1.9599999999999991)
答案 1 :(得分:31)
回答这个问题可能为时已晚,但由于谷歌仍然在这里引导人们,我决定在这里写下我的解决方案。
也就是说,自Python 2.7以来,math
库集成了错误函数math.erf(x)
erf()
函数可用于计算传统统计函数,例如累积标准正态分布:
from math import *
def phi(x):
#'Cumulative distribution function for the standard normal distribution'
return (1.0 + erf(x / sqrt(2.0))) / 2.0
价:
https://docs.python.org/2/library/math.html
https://docs.python.org/3/library/math.html
How are the Error Function and Standard Normal distribution function related?
答案 2 :(得分:18)
改编自http://mail.python.org/pipermail/python-list/2000-June/039873.html
from math import *
def erfcc(x):
"""Complementary error function."""
z = abs(x)
t = 1. / (1. + 0.5*z)
r = t * exp(-z*z-1.26551223+t*(1.00002368+t*(.37409196+
t*(.09678418+t*(-.18628806+t*(.27886807+
t*(-1.13520398+t*(1.48851587+t*(-.82215223+
t*.17087277)))))))))
if (x >= 0.):
return r
else:
return 2. - r
def ncdf(x):
return 1. - 0.5*erfcc(x/(2**0.5))
答案 3 :(得分:14)
基于Unknown的例子,在很多库中实现的函数normdist()的Python等价物将是:
def normcdf(x, mu, sigma):
t = x-mu;
y = 0.5*erfcc(-t/(sigma*sqrt(2.0)));
if y>1.0:
y = 1.0;
return y
def normpdf(x, mu, sigma):
u = (x-mu)/abs(sigma)
y = (1/(sqrt(2*pi)*abs(sigma)))*exp(-u*u/2)
return y
def normdist(x, mu, sigma, f):
if f:
y = normcdf(x,mu,sigma)
else:
y = normpdf(x,mu,sigma)
return y
答案 4 :(得分:8)
Alex的回答显示了标准正态分布的解决方案(平均值= 0,标准偏差= 1)。如果您使用mean
和std
(sqr(var)
)进行正态分发,并且您想要计算:
from scipy.stats import norm
# cdf(x < val)
print norm.cdf(val, m, s)
# cdf(x > val)
print 1 - norm.cdf(val, m, s)
# cdf(v1 < x < v2)
print norm.cdf(v2, m, s) - norm.cdf(v1, m, s)
答案 5 :(得分:1)
从上方拍摄:
from scipy.stats import norm
>>> norm.cdf(1.96)
0.9750021048517795
>>> norm.cdf(-1.96)
0.024997895148220435
对于两尾测试:
Import numpy as np
z = 1.96
p_value = 2 * norm.cdf(-np.abs(z))
0.04999579029644087
答案 6 :(得分:1)
从Python 3.8
开始,标准库提供NormalDist
对象作为statistics
模块的一部分。
它可以用于获取 累积分布函数 (cdf
-随机样本X小于或等于x的概率)给定的平均值(mu
)和标准偏差(sigma
):
from statistics import NormalDist
NormalDist(mu=0, sigma=1).cdf(1.96)
# 0.9750021048517796
可以将其简化为标准正态分布(mu = 0
和sigma = 1
):
NormalDist().cdf(1.96)
# 0.9750021048517796
NormalDist().cdf(-1.96)
# 0.024997895148220428
答案 7 :(得分:0)
像这样的简单
import math
def my_cdf(x):
return 0.5*(1+math.erf(x/math.sqrt(2)))
我在此页面https://www.danielsoper.com/statcalc/formulas.aspx?id=55
中找到了公式答案 8 :(得分:-7)
Google为搜索 netlogo pdf 提供了这个答案,这里是上面python代码的netlogo版本
;; Normal distribution cumulative density function to-report normcdf [x mu sigma] let t x - mu let y 0.5 * erfcc [ - t / ( sigma * sqrt 2.0)] if ( y > 1.0 ) [ set y 1.0 ] report y end ;; Normal distribution probability density function to-report normpdf [x mu sigma] let u = (x - mu) / abs sigma let y = 1 / ( sqrt [2 * pi] * abs sigma ) * exp ( - u * u / 2.0) report y end ;; Complementary error function to-report erfcc [x] let z abs x let t 1.0 / (1.0 + 0.5 * z) let r t * exp ( - z * z -1.26551223 + t * (1.00002368 + t * (0.37409196 + t * (0.09678418 + t * (-0.18628806 + t * (.27886807 + t * (-1.13520398 +t * (1.48851587 +t * (-0.82215223 + t * .17087277 ))))))))) ifelse (x >= 0) [ report r ] [report 2.0 - r] end