代表性样本量计算。

时间:2018-11-13 00:32:11

标签: random open-source

我想手动分析三个大型软件项目的错误报告。三个项目的错误报告总数为10,000、12,000和8000。我需要检查错误报告,注释和错误修复文件。手动分析所有错误报告是一项耗时且困难的任务。由于这些原因,我想从每个项目中提取错误报告的样本。您能否建议我,我应该分析每个项目有多少个错误报告,以得出具有代表性的样本量。

1 个答案:

答案 0 :(得分:3)

这取决于以下两件事:

置信度:它告诉您您的自信程度。 95%的置信度意味着您可以确定95%的置信度; 99%的置信度意味着您可以99%的确定。大多数研究人员使用95%的置信度。

置信区间(误差范围):它是正负数字,是与实际结果的可接受偏差。大多数研究人员使用5%的置信区间。

因此,您可以使用95%的置信度和5%的置信区间来生成样本量。

例如

The population size of project A=10,000
Confidence Level = 95%
Confidence Interval =5%
So, representative sample size=370 (That means you should analyze 370 bug reports for project A)

我通常使用样本量计算器来计算样本量。  (https://www.surveysystem.com/sscalc.htm#one