根据受众特征对用户进行分类

时间:2017-06-20 06:08:24

标签: machine-learning statistics classification analytics prediction

我正在开展个人项目,只是为了好玩。基本上我收集了有关每个国家的人口统计信息的数据,如:

德国74%男性26%女性10%结婚16%年龄30-35岁40%等

现在我想要做的是当我得到一个新用户时,我看到该用户的国家并试图预测用户的信息,即用户是否为已婚并且年龄为30-35岁的男性(只是一个例子)。

我的问题是如何做出这样的预测,我不能制定一条规则,即如果一个国家的男性人数超过50%,那么这个国家的新用户也是男性。基本上我想知道如何确定有助于我确定地预测用户人口统计数据的价值。

1 个答案:

答案 0 :(得分:1)

这不是一个真正的预测,而是一个概率问题,因为如果你有所描述的值,你可以计算所有概率。

以下是一个例子:

Male population = 74%
People married = 16% 
People between 30-35 = 40%

为了让新德国用户成为男性,已婚和30-35岁之间的可能性,您可以执行以下操作:

P(Male|Married|30-35) = p(Male) * p(Married) * p(30-35)
P(Male|Married|30-35) = 0,74 * 0,16 * 0,40 = 0,04736 ~ 4,7%

您无需更多计算。如果您想自动对所有用户进行分类,建议您查看Naive Bayes Classification