用一句话(标题)描述我的问题并不容易。我想通过问他们一些问题来找到一个人的兴趣,以便为他分配属性。
例如:在10个问题中(你喜欢技术吗?你对经济学感兴趣吗?你的食物多于阅读吗?),我希望能够找到人们的兴趣(技术,书籍阅读,经济学...... )为了给他一些属性,如技术,文学,政治......我也希望我的程序从用户的答案中学习属性。
我正在寻找一种可以帮助我分配属性的算法。对我来说,这不是一个简单的二进制搜索(20个问题AI或类似的)算法,而是一个类似群集的AI。
你对这个问题有什么建议吗?
答案 0 :(得分:1)
首先,分类是监督学习,而聚类是无监督的。你可以在这样的监督学习中思考:
我已将所有这些群体分类,我有一个新的个人/一组个人,哪个群体最适合个人? 当您训练模型时(例如:手工将电子邮件标记为垃圾邮件),您的个人最有可能被正确分类。
等效问题但在无监督学习中被称为聚类,你有一个数据集,你没有可支持的模型,你想得到一个想法(这最适合探索性分析)你的数据基于一些指标(方差,同一组中每个人之间的平均距离,依此类推)。
您是否尝试过使用基于关联规则的学习?