从创建数据样本。概率分布与另一列数据集的PD紧密匹配的数据集

时间:2018-09-10 19:20:59

标签: python data-analysis analysis probability-distribution

我有一张ID和年龄表。假设它为表1。表1中的行为1000。我的表2中有10000行。我需要从表2中选择1000行,以便table2.age具有与table1.age相同的概率分布。有什么办法可以在python中做到这一点吗?我不知道从哪里开始。换句话说,让我们估计最适合表1中1000个样本的概率分布,然后从另一个表构造一个样本,该样本将最接近原始概率分布估计。

0 个答案:

没有答案