使用scipy,我想了解一下我的对数正态分布生成随机变量的可能性。
要做到这一点,我已经考虑过了它与PDF的最大距离。
到目前为止我的方法是这样:如果变量是r = 1.5
,并且分布σ= 0.5,则从PDF lognorm.pdf(r, 0.5, loc=0)
中找到值。鉴于结果(0.38286..
),我想查找PDF的哪个区域低于0.38286..
。
如何实施最后一步?这甚至是解决这个问题的正确方法吗?
提供问题的更一般示例。假设有人告诉我他们在Twitter上有126个粉丝。我知道Twitter粉丝是一个对数正态分布,我有该分布的PDF。鉴于这种分布,我确定这些粉丝的数量是多么可信?
答案 0 :(得分:2)
lognorm.cdf(r, 0.5, loc=0)
你可以用它来计算的一件事是Folded Cumulative Distribution(提到here),也被称为“山地图”:
FCD = 0.5 - abs(lognorm.cdf(r, 0.5, loc=0) - 0.5)
答案 1 :(得分:0)
与hayden的相同结果
对于具有不对称分布的统计检验,我们通过取两个尾概率的最小值得到p值
>>> r = 1.5
>>> 0.5 - abs(lognorm.cdf(r, 0.5, loc=0) - 0.5)
0.20870287338447135
>>> min((lognorm.cdf(r, 0.5), lognorm.sf(r, 0.5)))
0.20870287338447135
这通常会加倍以获得双边p值,但最近有一些论文提出了双倍的替代方案。