LUIS-针对两个聊天机器人意图的类似训练话语

时间:2019-09-05 08:30:42

标签: machine-learning nlp chatbot luis disambiguation

预想:我正在使用ML Luis framework开发聊天机器人。基本上,这是一个黑盒框架,我不知道如何针对此问题以正确的方式对其进行调整。

我的聊天机器人有两个意图/课程。为简单起见,请说:

  • 喜欢
  • 不喜欢
这是两个说的意图。在我的训练集中,我有两个课程:

喜欢类:

  

我喜欢

     

我喜欢猫

     

我真的很喜欢鼠标

不喜欢课程:

  

喜欢

     

不喜欢喜欢海豚

     

我真的喜欢狗

对于训练集短语,这两个类确实非常相似,当我尝试对属于两个类之一的短语进行一些预测时,分数确实接近,例如:

 I like armadillos -> 0.86 like | 0.8 don't like

基本上,这两个域/类有很大的重叠,并且仅一个词就不同(如示例所示,不要)。有没有一种方法可以有效地训练模型(使用Luis 1)来增加相似发音之间的得分差异?

1 个答案:

答案 0 :(得分:0)

LUIS主要使用conditional random field(CRF)提取实体(请参见here)。由于在CRF中,概率是根据单词序列计算的,因此您无法更改LUIS中的任何因子。因为两种情况下的单词顺序都非常相似。

要解决此问题,您可以在LUIS之外进行一些处理,或者准备更多的语音让LUIS识别出差异。但是,后一种解决方案可能没有我在第一段中解释的那么有用。