我正在解析员工的简历并在带有相应字段(姓名,电子邮件,手机号码)的文本框中显示,这与每个单词比较正则表达式电子邮件,姓名,手机号码。我想从他的简历中获得员工的技术技能,如C#.net,Asp.net,WCF ......等。
如何通过假设员工在他的简历中写下他的技能来比较和获取技术词汇,如word1,word2,.......等等,
那有没有正则表达式?或者有可能得到那个吗?请帮帮我吗?
答案 0 :(得分:3)
正则表达式不适用于此方案。
您似乎对关键字分析感兴趣。正则表达式旨在查找文本模式,例如从+ \ d- \ d \ d \ d- \ d \ d \ d \ d字符串中识别电话号码(这样无论您在何处键入+ 1-555-2025,您都可以获得电话号码)。对于电子邮件也是如此,这正是垃圾邮件发送者如何收集在网络上粉碎的电子邮件地址。
您无法使用正则表达式来匹配技能。而是创建一个共同技能的数据库,并在文本中搜索它们。您还会发现有些候选人可能会写“VB.NET"或者" VB点网"等
答案 1 :(得分:0)
为什么不保存在技能数据库中,使用每种技能的常见不同单词数组,并在每次比较中找出是否存在。如果没有,只需添加它。 代码看起来就像简单的字符串比较一样。
答案 2 :(得分:0)
如果你只是寻找以逗号分隔的值,你可以这样做:
IEnumerable<string> skills = resume.split(',').Select(skill=> skill.Trim());