创建两个相同的测试和控制样本

时间:2016-05-10 22:28:07

标签: sql sas proc

我有一个包含500,000个帐户的数据集。

我将对这个小组进行一些分析,我需要进行测试和控制。

我希望我的控制率为2%(10,000个账户),我的测试值为98%。

我知道我可以使用随机变量或proc surveryselect来获得这2%的样本。

但关键是我希望我的测试和控制对变量x具有相同的平均值(让我们说是account_age)。

在SAS中是否还有进行横向选择或其他方式来获取样本,其中一个度量标准对于两个组具有相同的平均值(整个表和该表中的采样子集)?

1 个答案:

答案 0 :(得分:1)

您正在寻找的是分层样本。在这种情况下,分层是按年龄。

您可以执行以下操作:

  • 按account_age
  • 对数据进行排序
  • 为两组中的每一组取1/50记录

您可以使用排序数据上的 nth 样本执行此操作。