如何使用线性回归模型为工作推荐选择培训数据集?

时间:2016-10-18 12:02:33

标签: machine-learning data-science

  

我在database.one中有两种配置文件   prodile,另一个是招聘人员发布的职位档案。

     

在两个配置文件中我有3个常见字段说位置,技能和   经验

     

我知道算法,但我在创建训练数据时遇到了问题   设置我的输入功能将选择的位置,技能和工资   来自候选人简介,但我没有得到如何选择输出   (相关工作简介)。

     

据我所知输出只能是单个变量,那么如何   选择相关的工作档案作为我的训练集中的输出

或者我应该选择其他方法?另一种想法是聚类。

2 个答案:

答案 0 :(得分:3)

据我了解,您希望使用一些预测算法预测候选人资料的工作档案。

好吧,如果你想使用回归,你需要知道一些历史数据 - 哪些候选人得到哪些工作,然后你可以根据这些历史数据创建一些模型。如果您没有此类训练数据,则需要其他一些算法。比如,您可以将location,skill and experience设置为3d中的要素,并使用群集/最近邻居来查找最接近作业配置文件的候选人配置文件。

答案 1 :(得分:2)

您可以查看“推荐系统”,它们可以解决您的问题。 从基于内容的算法开始(您必须找到一种自动化作业标签的方法,或者手动执行它们),您可以通过收集用户实际感兴趣的作业(并成为混合推荐器)来改进混合类型)