将用户档案与就业机会相匹配

时间:2017-07-17 06:04:41

标签: machine-learning text-analysis

我目前正在研究一种可以根据用户个人资料将用户连接到作业的软件。我对作业描述进行了文本分析,并从中导出了重要的关键字。我还从他们的个人资料中收集了用户信息。将作业与用户配置文件相匹配似乎是一项具有挑战性的任务。是否有任何基于机器学习的算法可用于匹配?

1 个答案:

答案 0 :(得分:2)

好的,基本上,你有每个职位描述的关键字,然后你有一些你试图匹配这些关键字的文本数据(用户配置文件)。

由于您的培训数据(用户个人资料)未标记,supervised learning对您没有帮助。 Unsupervised learning(群集)可以帮助您从大量用户配置文件中找到某些模式(关键字),但您肯定需要尝试不同类型的技术(例如gaussian mixture models等)并观察可能的模式。

您可能做的更简单的事情是为每个用户配置文件派生/查找关键字(换句话说,确定用户配置文件中也存在多少个工作关键字),然后使用{{3比较它们之间的距离}}。然后,您只需要确定最小角度阈值。这将是一个参数。当然,你需要使用bigrams或类似的方式对文本数据进行矢量化;如果你使用python,scikit中已经有cosine similarity。您也可以在两者上使用feature extraction矢量化工具,工作描述和用户个人资料,但是有一些沉重且确定良好的单词停止列表。