工作描述(JD解析)的文本解析的最佳方法?

时间:2018-02-16 09:15:23

标签: parsing artificial-intelligence text-parsing fuzzy-logic

我是一名开发人员,对文本解析知之甚少。 我需要解析Job描述并得到一些输出。我需要解析职位描述中的以下字段。

工作职责, 资格, 专业化, 域, 所需技能, 职位描述, 工作经验Min, 工作经历Max, 行业, 占用, 功能区域, 货币, 薪水, 薪资类型, 雇佣类型, 工作授权, 所需签证状态, 要求的英语水平, 国家, 州, 市, 邮政编码, 工作地址。

为了实现这一点,我正在使用Regex模式匹配。但输出效率低很多倍。有时需要精确的模式来识别参数。所以它失败了很多次。

我也找到了其他方法。

  1. 指定实体识别: 通过使用Stanford NLp,我可以获得位置,地址。但我不知道如何训练模块用于其他参数或我们有任何可能性。
  2. 模糊逻辑: 做了一些关于模糊逻辑的研究来验证结果。
  3. 我的问题是,

    1. What are the approaches to accomplish the JD parsing? 
    
    2. How effective is NER? 
    
    3. Is there any conceivable outcomes to use fuzzy logic in JD text parsing? 
    

    任何帮助都会非常适合。

1 个答案:

答案 0 :(得分:0)

我认为,如果regex无法正常运行,您可以尝试进行依赖项解析。 NER不会支持您需要的所有发现。就业类型也是您想向您学习的东西。