通过浏览历史记录选择算法来估计用户性别

时间:2014-08-04 13:34:30

标签: machine-learning classification

我的任务是分析用户的网络历史记录,以估算年龄性别。作为输入,我有很多用户浏览历史记录的数据。但对我来说,主要的复杂性是为此选择合适的算法。据我所知,最简单的方法是按男女比例对所有网站进行排名,并使用其中一种分类算法。我对吗?你能帮我选择合适的算法吗?

1 个答案:

答案 0 :(得分:0)

您可以从Naive Bayes分类器开始,与早期版本的垃圾邮件过滤器中使用的分类器相同。

我们的想法是为每个网址提供一个分数,例如,在浏览历史记录中包含该网址的男性比例,并将所有网址的所有分数合并到一个人的浏览器历史记录中,以尝试预测其类型