概率和相对频率

时间:2009-05-08 15:54:37

标签: math statistics probability

如果我使用相对频率来估计事件的概率,根据实验数量我的估计有多好?标准差是一个好的衡量标准吗?一篇论文/链接/在线书籍将是完美的。

http://en.wikipedia.org/wiki/Frequentist

3 个答案:

答案 0 :(得分:4)

我相信您正在寻找样本比例的置信区间。以下是一些可能有用的资源:

Confidence Interval for Proportion Tutorial
Confidence Interval for Proportion Handout

基本上,您的估算值会与样本数的平方根成比例地增加。因此,如果您想将错误减半,则需要四倍的样本。

答案 1 :(得分:0)

可能你想要的是卡方检验。例如,请参阅Pearson's chi-square test上的维基百科页面。标准偏差不是您想要的,因为这是关于分布的形状,而不是您估计的实际分布的准确度。另外,请注意,大多数这些都是关于“正常”的分布,并非所有分布都是正常的。

答案 2 :(得分:0)

你计算是/否实验的序列n中的成功次数,对吧?只要单个实验是独立的,您就处于二项分布(Wikipedia)的范围内。成功频率f = s / n是成功概率p和的估计量。对于n次抽样,频率估计f的方差为p *(1-p)/ n。

只要p不是太接近零或1,并且只要你没有“太小”的观察次数n,标准偏差将是估算f质量的合理量度。

如果n足够大(经验法则n * p> 10),则可以通过正态分布N(f,f *(1-f)/ n)进行近似,并且标准偏差估计是一个很好的衡量标准。有关更广泛的讨论,请参阅here

这就是说,如果需要有一定的学术严谨性(例如作业),标准差的近似值不会减少任何冰。