我不确定这是否应该在这里发布(因为它是与编程相关的问题)或数学(因为它可能是统计的),或者即使它是一个有效的问题。如果您认为我发布在错误的网站上,请告诉我们!
对于我的最后一年项目,我正在开发一个在线投资组合网站,用户可以在其中创建账户,输入他们的技能,评估每项技能(来自(例如)1-bad 5-ok-excellent),他们的工作经历,相关经验,工作实例和联系方式。这被拒绝的理由太简单了。
为了强化项目,我提出了雇主的观点,允许雇主智能地搜索潜在的雇员,每个结果(用户)根据他们和他们的技能符合标准的程度进行排名。
由于我的打嗝,我不再能够改变我的项目,只是不得不处理我的建议。
编辑以使我的问题更清晰
假设我有以下两个用户:
用户1:技能等级为10(优秀)的“PHP”和技能等级为6的“jQuery”(确定)
用户2:“PHP”,技能等级为5(ok),“jQuery”技能等级为9(优秀)。
让我们说雇主搜索“PHP”,是否有任何我可以研究的工具,理论或技术可以让我根据给定的标准开发基于所有相关用户技能的排名算法?
在上面的示例中,用户1将在用户2之前排名,因为他们在PHP中具有更高的技能级别。但是如果搜索“PHP,jQuery”,那么用户2将排名第一,因为它们与搜索更相关。
我希望能更好地解释我的问题!
答案 0 :(得分:1)
还没有数据挖掘。
您所谈论的是排名,因为它在信息检索中的所有位置都已完成。
然而,你似乎未定的与使用哪种相似性功能。嗯,这取决于你,没有一个工具可以为你解答这个问题。他们会给你更多你以前没想过的选择。最简单的是曼哈顿距离 - 即总结每个给定标准的差异。
我希望你的导师仍然“太容易”了。您应该能够将请求编译为单个SQL查询(字面意思是:计算得分总和,按求和排序),并让数据库轻松地回答您并具有良好的性能。毕竟,你不会处理数十亿的简历。遗憾。