预想:我正在使用ML Luis framework开发聊天机器人。基本上,这是一个黑盒框架,我不知道如何针对此问题以正确的方式对其进行调整。
我的聊天机器人有两个意图/课程。为简单起见,请说:
喜欢类:
我喜欢
我喜欢猫
我真的很喜欢鼠标
不喜欢课程:
我不喜欢
我不喜欢喜欢海豚
我真的不喜欢狗
对于训练集短语,这两个类确实非常相似,当我尝试对属于两个类之一的短语进行一些预测时,分数确实接近,例如:
I like armadillos -> 0.86 like | 0.8 don't like
基本上,这两个域/类有很大的重叠,并且仅一个词就不同(如示例所示,不要)。有没有一种方法可以有效地训练模型(使用Luis 1)来增加相似发音之间的得分差异?
答案 0 :(得分:0)
LUIS主要使用conditional random field(CRF)提取实体(请参见here)。由于在CRF中,概率是根据单词序列计算的,因此您无法更改LUIS中的任何因子。因为两种情况下的单词顺序都非常相似。
要解决此问题,您可以在LUIS之外进行一些处理,或者准备更多的语音让LUIS识别出差异。但是,后一种解决方案可能没有我在第一段中解释的那么有用。