我是一名开发人员,对文本解析知之甚少。 我需要解析Job描述并得到一些输出。我需要解析职位描述中的以下字段。
工作职责, 资格, 专业化, 域, 所需技能, 职位描述, 工作经验Min, 工作经历Max, 行业, 占用, 功能区域, 货币, 薪水, 薪资类型, 雇佣类型, 工作授权, 所需签证状态, 要求的英语水平, 国家, 州, 市, 邮政编码, 工作地址。
为了实现这一点,我正在使用Regex模式匹配。但输出效率低很多倍。有时需要精确的模式来识别参数。所以它失败了很多次。
我也找到了其他方法。
我的问题是,
1. What are the approaches to accomplish the JD parsing?
2. How effective is NER?
3. Is there any conceivable outcomes to use fuzzy logic in JD text parsing?
任何帮助都会非常适合。
答案 0 :(得分:0)
我认为,如果regex无法正常运行,您可以尝试进行依赖项解析。 NER不会支持您需要的所有发现。就业类型也是您想向您学习的东西。