标签: r
是否可以在r中根据较小文件的分布从大文件中选择样本?例如,如果我有一个具有特定年龄分布的客户数据库,并希望将其与具有相同年龄分布的国家人口进行比较。假设样本中23%的客户占2%,24岁时占3%,但对于整个国家,我们的分布完全不同。所以基本上我想用相同的分布扩展样本。
这可以使用多个变量来完成,比如年龄和邮政编码吗?