Question

我想手动分析三个大型软件项目的错误报告。三个项目的错误报告总数为10,000、12,000和8000。我需要检查错误报告，注释和错误修复文件。手动分析所有错误报告是一项耗时且困难的任务。由于这些原因，我想从每个项目中提取错误报告的样本。您能否建议我，我应该分析每个项目有多少个错误报告，以得出具有代表性的样本量。

Answer 1

这取决于以下两件事：

置信度：它告诉您您的自信程度。 95％的置信度意味着您可以确定95％的置信度； 99％的置信度意味着您可以99％的确定。大多数研究人员使用95％的置信度。

置信区间（误差范围）：它是正负数字，是与实际结果的可接受偏差。大多数研究人员使用5％的置信区间。

因此，您可以使用95％的置信度和5％的置信区间来生成样本量。

例如

The population size of project A=10,000
Confidence Level = 95%
Confidence Interval =5%
So, representative sample size=370 (That means you should analyze 370 bug reports for project A)

我通常使用样本量计算器来计算样本量。（https://www.surveysystem.com/sscalc.htm#one）

代表性样本量计算。

1 个答案: