Question

预想：我正在使用ML Luis framework开发聊天机器人。基本上，这是一个黑盒框架，我不知道如何针对此问题以正确的方式对其进行调整。

我的聊天机器人有两个意图/课程。为简单起见，请说：

这是两个说的意图。在我的训练集中，我有两个课程：

喜欢类：

我喜欢

我喜欢猫

我真的很喜欢鼠标

不喜欢课程：

我不喜欢

我不喜欢喜欢海豚

我真的不喜欢狗

对于训练集短语，这两个类确实非常相似，当我尝试对属于两个类之一的短语进行一些预测时，分数确实接近，例如：

 I like armadillos -> 0.86 like | 0.8 don't like

基本上，这两个域/类有很大的重叠，并且仅一个词就不同（如示例所示，不要）。有没有一种方法可以有效地训练模型（使用Luis 1）来增加相似发音之间的得分差异？

Answer 1

LUIS主要使用conditional random field（CRF）提取实体（请参见here）。由于在CRF中，概率是根据单词序列计算的，因此您无法更改LUIS中的任何因子。因为两种情况下的单词顺序都非常相似。

要解决此问题，您可以在LUIS之外进行一些处理，或者准备更多的语音让LUIS识别出差异。但是，后一种解决方案可能没有我在第一段中解释的那么有用。