如何在不更换的情况下进行按比例分层抽样?

时间:2016-05-05 07:43:57

标签: stata sampling

我想在Stata 13中根据三个阶层变量选择我的样本,总共12个阶层(规模 - 两个阶层;部门 - 三个阶层;无形强度 - 两个阶层)。选择应该是成比例的而无需替换。

但是,我只能找到不成比例的选择命令,例如选择每个层的x%。

任何人都可以帮我解决这个问题吗?

2 个答案:

答案 0 :(得分:0)

感谢您的讨论。我想我知道我的问题在哪里。

命令“gsample”可以根据不同的变量选择分层。因此,我认为我必须定义三个不同的阶层变量。但解决方案应该更简单。

共有12个阶层(第1部门强度较高的大公司,第1部门强度较高的小公司,等等),样本中的每个公司都落入其中一个阶层。

我所要做的就是创建一个变量“strataident”,其值为1到12,用于识别不同的层。我这样做是为了填充人口数据集,因此落入每个阶层的公司数量代表了人口。以下代码将为我提供一个代表人口的分层随机样本。

gsample 10, percent strata (strataident) wor

此命令也可以使用,并且更容易,请参阅1中的示例:

gsample 10, percent wor strata(size sector intensity)

答案 1 :(得分:-1)

问题是,这个阶层可能会重叠"。因此,您可能必须在初始草稿后重新平衡样本。

现在的问题是,如何实施。最终样本应尽可能地代表人口比例。