可变实体提取 - 句子实体中没有模式 - NLP

时间:2018-03-19 12:17:42

标签: python nlp nltk luis

我正在开发一个客户支持机器人,可帮助业务用户理解某些技术术语的含义或某些请求的状态。典型的句子如下所示

  1. 向我解释空气压缩机/加热和冷却系统/法律 热力学
  2. 获取Ticket123 / HEATER12
  3. 的状态

    到目前为止我做了什么

    我目前使用Microsoft LUIS来识别我上传所有可能实体的实体,LUIS进行字符串匹配并返回它们。这种方法的问题是

    • 实体列表不断变大,需要每天更新
    • 用户可能输入拼写错误 - 在某些情况下,用户类型一词可能不是要更正拼写的字典单词。

    我的解决方案是什么(似乎效果不佳)

    我目前正在考虑一种标记POS并将名词短语/名词分组的方法,但我认为这不是一种有效的方法。

    还有一点需要注意的是,实体不遵循任何模式。我的方法应该在这里。任何指针都会受到赞赏。

2 个答案:

答案 0 :(得分:0)

您正在尝试解决两个不同的问题

  1. 管理知识库以回答用户要学习/理解的问题
  2. 提供特定票证的状态

第一部分可以通过使用Q&A maker服务进行全面管理,而无需使用任何代码。请参阅... https://www.qnamaker.ai/

第二部分的唯一目的是基于实体值(票证)从数据库中获取值。

仅在第二部分中专注于构建和微调该bot,并将Q&A厂商整合为知识库,这将处理第一部分。

答案 1 :(得分:0)

您可能会在下面遇到问题:

  1. 列出Excel中的所有实体,如果它越来越大,您只需要在excel中添加更多行,而不是在代码上。之后,编写正则表达式以使您的实体与所需信息匹配。

  2. 对于拼写错误:您可以实现类似Fuzzywuzzy in Python的东西。您将获得最接近的匹配项,然后可以应用步骤1来捕获您的实体。