我的任务是分析用户的网络历史记录,以估算年龄性别。作为输入,我有很多用户浏览历史记录的数据。但对我来说,主要的复杂性是为此选择合适的算法。据我所知,最简单的方法是按男女比例对所有网站进行排名,并使用其中一种分类算法。我对吗?你能帮我选择合适的算法吗?
答案 0 :(得分:0)
您可以从Naive Bayes分类器开始,与早期版本的垃圾邮件过滤器中使用的分类器相同。
我们的想法是为每个网址提供一个分数,例如,在浏览历史记录中包含该网址的男性比例,并将所有网址的所有分数合并到一个人的浏览器历史记录中,以尝试预测其类型