计算一个样本中某个比例的置信区间

时间:2018-08-10 21:56:53

标签: python statistics confidence-interval

当样本量很小甚至样本量为1时,按比例计算置信区间(CI)的更好方法是什么?

我目前正在计算一个样本中具有以下比例的CI: enter image description here

但是,我的样本量很小,有时甚至是1。我也尝试过 使用以下项对一小部分人口p的近似(1-α)100%置信区间: enter image description here

具体来说,我正在尝试实现这两个公式来计算比例的CI。如下图所示,在2018年第一季度,蓝色组周围没有配置项,因为在2018年第一季度,每1个人中就有1个人选择该项目。如果使用有限人口校正(FPC),则如果N为1,则不会校正CI。 因此,我的问题是,用100%的比例来解决这个小样本量问题的最佳统计方法是什么。

enter image description here

  • 如果您可以在python中提供一个软件包来计算它,那将是很棒的吗?谢谢!

1 个答案:

答案 0 :(得分:1)

尝试 statsmodels.stats.proportion.proportion_confint

http://www.statsmodels.org/devel/generated/statsmodels.stats.proportion.proportion_confint.html

根据他们的文档,您可以像这样使用它:

ci_low, ci_upp = proportion_confint(count, nobs, alpha=0.05, method='normal')

其中的参数是:

  • count(int或array_array_like)–成功次数,可以是Pandas Series或DataFrame
  • nobs(int)–试用总数
  • alpha(在(0,1)中浮动)–显着性水平,默认为0.05
  • 方法(['normal']中的字符串)–用于置信区间的方法,当前可用的方法:

    • normal:渐近正态逼近
    • agresti_coull:Agresti-Coull间隔
    • beta:基于Beta分布的Clopper-Pearson区间
    • wilson:威尔逊得分间隔
    • jeffreys:Jeffreys贝叶斯区间
    • binom_test:实验性,binom_test的反转