botframework - 即使完全充满信心，LUIS也无法识别所有实体

时间：2018-08-01 09:48:30

标签： botframework luis

我有一个特定的意图，例如“昨天睡觉时你在梦什么”。标有标签的实体有梦，梦，睡觉和昨天。

但是，即使我测试了确切的短语，虽然它完全表达了意图，但它并不会提取所有实体，而只是提取“ what”部分。

正确标记了实体，所以我不明白为什么它不能提取它们。我在这里缺少一些最佳实践吗？

编辑：

我还应该补充一点，因为领域有很多重叠，所以我在数千个意图之间分配了数千个话语。我想知道这是否可能是一个问题-同一意图的更简单的言语（较少的实体）干扰了更复杂的言语（更多实体）？

编辑2：

我已经使用LUIS API设置了所有话语，并使用网站进行了培训和测试。

我只使用了一些简单的含义，例如“事实”，“观点”和“解释”。

只有15个实体，它们是简单的组，例如“情感”（伤害，爱，恐惧），“个人”（父亲，母亲，妹妹）和“食物”（汉堡，三明治）。

在所有这些意图中，都有成千上万的示例话。

以下是LUIS网站上原始表达形式的图片：

以下是使用LUIS网站上的“实体视图”时相同发音的图像：

如您所见，实体在发声中的位置有些复杂。同样，由于话语太多，我不知道LUIS是否会尝试选择最简单的话而忽略更复杂的话（也许这就是为什么它没有提取所有实体的原因？）

忽略其中一个实体被命名为“意图”，这只是该实体的方便名称。

直接示例显示了使用这些确切话语之一的情况。它得到了正确的意图，但只提取了一个实体：

答案 0 :(得分：0)

@ user9862995

我能够通过执行以下操作提取所有实体：

结果：话语中的所有4个实体都被提取

因此，鉴于您提供给我的信息，我现在可以看到的唯一区别是您添加的语音数量。很难准确地确定为什么在您的案例中未充分发现这些实体的原因（例如，一个单词可能被标记为多个实体，从而使LUIS或其他原因造成混淆）。

您是否可以共享模型的JSON？

如果没有，那么给出当前信息的最佳答案将是遵循文档中概述的best practices，特别是迭代构建和测试，而不是一次添加成千上万的发音-它可以可能是导致您看到输出的鸡尾酒行为的几个冲突规则！

此外，请确保访问LUIS应用程序的“查看终结点话语”部分，并利用LUIS的active learning来提高收到的结果的质量。通过积极学习，

LUIS检查所有端点话语并选择符合以下条件的话语：这是不确定的。您可以标记/训练/发布到的这些话语更准确地识别语音。

答案 1 :(得分：0)

MS LUIS ...按下面的顺序工作...希望这可以给您一些想法。

话语过多可能会导致您面临的问题。使用符合意图的图案，可以以更高的精度减少所需的发声次数。需要在这里有所创意。