我想从一个点池中采样一个固定数量的点,使其满足某些条件。
有什么程序可以做到这一点? 如果有任何关于此主题的论文,那么也会有所帮助。
示例: 让我们考虑我们有10000个用户。关于每个用户,我知道那里有多少收入。现在让我们考虑,我想从该用户池中抽样150个用户,以使人口的平均收入变为M。 注意:此平均收入(条件)M与总人口平均值不同。
谢谢。
答案 0 :(得分:0)
如果程序的目标是每个样本中的收入分配均等,则可以使用分层抽样。您进行收入分类,然后从每个收入分类中随机抽取一个人样本。
有关更多理论信息,请参见Wikipedia页面:https://en.wikipedia.org/wiki/Stratified_sampling。
有关实现示例,请参见此处:Stratified random sampling from data frame