监督学习+分类

时间:2018-06-12 09:53:38

标签: tree

我有一个连续变量 - 每个月在不同行业工作的个人收入,大约有一百万的记录。我还有大约40个其他变量,例如教育水平,经验,行业等。我想根据不同的变量形成同质群体。最终目标是为每个同类群体构建某种形式的工资指数。例如,我可以根据可变行业构建工资指数,有50个不同的行业,因此有50个工资指数。问题是同一行业可能有两个人但教育程度不同,因而工资水平也不同,他们不应该在同一个群体中。一组可以是例如教育级别为1的行业x,另一组可以是具有教育级别2的行业x。如何使用机器学习以更好的方式形成同类组?

0 个答案:

没有答案