应用错误收集

我有一个目标受众或人群（P）中的样本（S），我必须从这些人群中扩展目标受众总数。样品可以是随机的或浓缩的。如果可能的话，我还需要一些相似性参数，例如该用户与样本相似。我的方法- 我正在为集合P-S中的每个条目计算距分布S的马氏距离（因为它计算出距分布s我的点x有多少标准偏差）我在上面对用户进行排名。

这是正确的方法还是有人可以建议我更好的方法？在我的数据库中，我为每个用户提供功能（包括分类值，例如，男性/女性等）并且所有数据都被标准化。（0-1）浮空

总体中样本的相似建模

0 个答案: