我想在Stata 13中根据三个阶层变量选择我的样本,总共12个阶层(规模 - 两个阶层;部门 - 三个阶层;无形强度 - 两个阶层)。选择应该是成比例的而无需替换。
但是,我只能找到不成比例的选择命令,例如选择每个层的x%。
任何人都可以帮我解决这个问题吗?
答案 0 :(得分:0)
感谢您的讨论。我想我知道我的问题在哪里。
命令“gsample”可以根据不同的变量选择分层。因此,我认为我必须定义三个不同的阶层变量。但解决方案应该更简单。
共有12个阶层(第1部门强度较高的大公司,第1部门强度较高的小公司,等等),样本中的每个公司都落入其中一个阶层。
我所要做的就是创建一个变量“strataident”,其值为1到12,用于识别不同的层。我这样做是为了填充人口数据集,因此落入每个阶层的公司数量代表了人口。以下代码将为我提供一个代表人口的分层随机样本。
gsample 10, percent strata (strataident) wor
此命令也可以使用,并且更容易,请参阅1中的示例:
gsample 10, percent wor strata(size sector intensity)
答案 1 :(得分:-1)
问题是,这个阶层可能会重叠"。因此,您可能必须在初始草稿后重新平衡样本。
现在的问题是,如何实施。最终样本应尽可能地代表人口比例。