许多工作网站都破坏了搜索,这些搜索不会让您按经验水平缩小工作范围。即使他们这样做,通常也是错误的。这需要您在找到相关的帖子之前浏览数百个您无法申请的帖子,这非常繁琐。由于我更专注于写封面信等,我想编写一个程序来查看大量的帖子,并保存那些不需要多年经验的工作的URL。
我不需要帮助编写刮刀来获取可能相关职位的html主体。问题是准确地检测工作所需的经验水平。这不应该太困难,因为工作岗位通常非常明确(“必须有5年的经验......”),但是过于简单的解决方案可能存在一些问题。
就我而言,我正在寻找入门级职位。他们通常不会说“入门级”,但包含这些词语可能意味着应该保存这份工作。
接下来,我可以安全地排除一份工作说它需要“5年”的经验,所以像/ \ d \ syears /这样的正则表达似乎是合理的排除工作。但后来,我意识到一些工作表明他们将花费0到2年的经验,与排除的正则表达相匹配但显然是我想要看的工作。嗯,我可以用另一个正则表达式处理它。但有人说“不到2年”或“不到2年”。也可以处理,但它让我想知道我没有想到的其他模式,并可能排除许多工作。这就是把我带到这里的原因,找到比正则表达式更好的方法,如果有的话。
我希望尽量减少误报率,并保存所有似乎不需要多年经验的工作。排除匹配/ [3-9] \ syears | 1 \ d \ syears /似乎合理的任何内容?或者,还有更好的方法?培训贝叶斯过滤器可能吗?
编辑:这是一个类似但更难的问题,可能更有用。有很多工作需要“工程学位”,因为你只需要了解一些技术方面的东西。但是,搜索“工程”可以为您提供数以千计的工作,这些工作大多无关紧要。
我如何将这范围缩小到那些需要任何工程学位而非特定学位的工作,而不是自己看每一个?
答案 0 :(得分:1)
好的,这个答案可能不会有所帮助 - 我会事先说出来。但是,在我看来,仅仅以这种方式思考问题就足以让你在我工作的大多数地方受雇。我的建议?在您感兴趣的任何帖子中联系招聘经理,告诉他们这就是您正在做的事情。一般地告诉他们你到目前为止编码了什么,并在撰写他们的广告时请求他们学习他们使用的模式。
如果我在收到这封信的接收端,我想我会邀请该人参加面试。
答案 1 :(得分:1)
当我为自己和几个朋友寻找工作时,我为几个工作网站开发了一个很好的解析和电子邮件程序。我同意其他帖子,这是查看问题的好方法。只是为了删除一些信息,我主要使用红宝石,并使用代理和其他一些方法来确保我不会被冻结在工作现场。这种项目与通常的刮擦不同,因为你真的无法承受起一个工作板。在任何情况下,我只有一条建议:忘记分类和微调这个过于激烈。让人力资源部门为您完成这项工作,并随处获取您的简历和证书。这是一个统计游戏,你想要自己播放并尽可能广泛地抛出网络。
答案 2 :(得分:0)
如果您有兴趣,可以参考以下示例代码。这是为了寻找单位,而不是工作,但概念应该足够相似。 http://github.com/agrimm/Easy-Roommate-parser