对数正态分布变量,找到可能性

时间:2012-09-20 09:44:22

标签: python statistics scipy

使用scipy,我想了解一下我的对数正态分布生成随机变量的可能性。

要做到这一点,我已经考虑过了它与PDF的最大距离。

到目前为止我的方法是这样:如果变量是r = 1.5,并且分布σ= 0.5,则从PDF lognorm.pdf(r, 0.5, loc=0)中找到值。鉴于结果(0.38286..),我想查找PDF的哪个区域低于0.38286..

如何实施最后一步?这甚至是解决这个问题的正确方法吗?

提供问题的更一般示例。假设有人告诉我他们在Twitter上有126个粉丝。我知道Twitter粉丝是一个对数正态分布,我有该分布的PDF。鉴于这种分布,我确定这些粉丝的数量是多么可信?

2 个答案:

答案 0 :(得分:2)

PDF下的区域是CDF(方便lognorm中的方法):

lognorm.cdf(r, 0.5, loc=0)

你可以用它来计算的一件事是Folded Cumulative Distribution(提到here),也被称为“山地图”:

FCD = 0.5 - abs(lognorm.cdf(r, 0.5, loc=0) - 0.5)

答案 1 :(得分:0)

与hayden的相同结果

对于具有不对称分布的统计检验,我们通过取两个尾概率的最小值得到p值

>>> r = 1.5
>>> 0.5 - abs(lognorm.cdf(r, 0.5, loc=0) - 0.5) 
0.20870287338447135
>>> min((lognorm.cdf(r, 0.5), lognorm.sf(r, 0.5)))
0.20870287338447135

这通常会加倍以获得双边p值,但最近有一些论文提出了双倍的替代方案。