Question

我是一名开发人员，对文本解析知之甚少。我需要解析Job描述并得到一些输出。我需要解析职位描述中的以下字段。

工作职责，资格，专业化，域，所需技能，职位描述，工作经验Min，工作经历Max，行业，占用，功能区域，货币，薪水，薪资类型，雇佣类型，工作授权，所需签证状态，要求的英语水平，国家，州，市，邮政编码，工作地址。

为了实现这一点，我正在使用Regex模式匹配。但输出效率低很多倍。有时需要精确的模式来识别参数。所以它失败了很多次。

我也找到了其他方法。

指定实体识别：通过使用Stanford NLp，我可以获得位置，地址。但我不知道如何训练模块用于其他参数或我们有任何可能性。
模糊逻辑：做了一些关于模糊逻辑的研究来验证结果。

我的问题是，

1. What are the approaches to accomplish the JD parsing? 

2. How effective is NER? 

3. Is there any conceivable outcomes to use fuzzy logic in JD text parsing?

任何帮助都会非常适合。

Answer 1

我认为，如果regex无法正常运行，您可以尝试进行依赖项解析。 NER不会支持您需要的所有发现。就业类型也是您想向您学习的东西。

工作描述（JD解析）的文本解析的最佳方法？

1 个答案: