推荐的AI /机器学习:配置文件输入,收入预测

时间:2012-10-05 17:54:26

标签: artificial-intelligence genetic-algorithm bayesian-networks

我的项目看起来像这样:我的数据集是一堆人物的个人资料,具有各种属性,例如: boolean hasJob和int healthScore,以及他们的收入。使用这些数据,我试图预测他们未来的收入。每个档案也有一个历史:例如,他们的属性和收入在过去。

所以从本质上讲,我试图将多组(x布尔,y数字)映射到一个数字(来年的工资)。

我考虑了神经网络,贝叶斯网络和函数拟合的遗传算法。有什么建议或意见吗?

提前致谢! --Emily

1 个答案:

答案 0 :(得分:1)

您想要做的是“时间序列建模”。但是,每个系列(每个人)可能只有非常少的数据。我认为很难找到一个适合每个人的模型,因为你做了一些一般的假设,例如:每个人都是以职业为导向。这也是一个嘈杂的目标,它可能是如果有人是甜食者,你必须考虑到。你怎么测量这样的东西?我很确定你当前的属性有足够的噪音,这使得很难预测任何事情。当你说健康状况时,你的意思是身体健康还是心理健康。在不同的企业中,不同的事情很重要那些他们正在从事的业务或行业呢?它的健康和增长潜力?我认为这会极大地影响他们的收入。我还认为你有因变量以及属性可能(并且可能)受目标变量的影响。 E. g。收入较高的人有更好的健康。这听起来像是一个非常复杂和困难的事情,绝对没有“我天真地将我的数据分组并尝试了一堆方法”将给出有意义的结果。我建议您了解有关时间序列建模的更多信息,尤其是有关您拥有的数据的信息。也许尝试从群集人员的初始属性开始,看看他们是如何发展的。是否存在与此开发相关的变量?

您的研究问题是什么?