我有一个包含500,000个帐户的数据集。
我将对这个小组进行一些分析,我需要进行测试和控制。
我希望我的控制率为2%(10,000个账户),我的测试值为98%。
我知道我可以使用随机变量或proc surveryselect来获得这2%的样本。
但关键是我希望我的测试和控制对变量x具有相同的平均值(让我们说是account_age)。
在SAS中是否还有进行横向选择或其他方式来获取样本,其中一个度量标准对于两个组具有相同的平均值(整个表和该表中的采样子集)?
答案 0 :(得分:1)
您正在寻找的是分层样本。在这种情况下,分层是按年龄。
您可以执行以下操作:
您可以使用排序数据上的 nth 样本执行此操作。