总体中样本的相似建模

时间:2019-06-20 04:37:36

标签: machine-learning data-analysis cosine-similarity locality-sensitive-hash

我有一个目标受众或人群(P)中的样本(S),我必须从这些人群中扩展目标受众总数。 样品可以是随机的或浓缩的。如果可能的话,我还需要一些相似性参数,例如该用户与样本相似。 我的方法- 我正在为集合P-S中的每个条目计算距分布S的马氏距离(因为它计算出距分布s我的点x有多少标准偏差) 我在上面对用户进行排名。

这是正确的方法还是有人可以建议我更好的方法? 在我的数据库中,我为每个用户提供功能(包括分类值,例如,男性/女性等) 并且所有数据都被标准化。 (0-1)浮空

0 个答案:

没有答案