即使完全充满信心,LUIS也无法识别所有实体

时间:2018-08-01 09:48:30

标签: botframework luis

我有一个特定的意图,例如“昨天睡觉时你在梦什么”。标有标签的实体有梦,梦,睡觉和昨天。

但是,即使我测试了确切的短语,虽然它完全表达了意图,但它并不会提取所有实体,而只是提取“ what”部分。

正确标记了实体,所以我不明白为什么它不能提取它们。我在这里缺少一些最佳实践吗?

编辑:

我还应该补充一点,因为领域有很多重叠,所以我在数千个意图之间分配了数千个话语。我想知道这是否可能是一个问题-同一意图的更简单的言语(较少的实体)干扰了更复杂的言语(更多实体)?

编辑2:

我已经使用LUIS API设置了所有话语,并使用网站进行了培训和测试。

我只使用了一些简单的含义,例如“事实”,“观点”和“解释”。

只有15个实体,它们是简单的组,例如“情感”(伤害,爱,恐惧),“个人”(父亲,母亲,妹妹)和“食物”(汉堡,三明治)。

在所有这些意图中,都有成千上万的示例话。

以下是LUIS网站上原始表达形式的图片: utterances raw

以下是使用LUIS网站上的“实体视图”时相同发音的图像: enter image description here

如您所见,实体在发声中的位置有些复杂。同样,由于话语太多,我不知道LUIS是否会尝试选择最简单的话而忽略更复杂的话(也许这就是为什么它没有提取所有实体的原因?)

忽略其中一个实体被命名为“意图”,这只是该实体的方便名称。

直接示例显示了使用这些确切话语之一的情况。它得到了正确的意图,但只提取了一个实体: enter image description here

2 个答案:

答案 0 :(得分:0)

@ user9862995

我能够通过执行以下操作提取所有实体:

  1. 创建“意见”意图
  2. 添加了屏幕截图中显示的4种言语
  3. 用话语标记实体-所有实体均为“简单”实体类型
  4. 火车
  5. 测试时我会说“您是否愿意在这辆旧卡车上骑shot弹枪”

结果:话语中的所有4个实体都被提取

enter image description here

因此,鉴于您提供给我的信息,我现在可以看到的唯一区别是您添加的语音数量。很难准确地确定为什么在您的案例中未充分发现这些实体的原因(例如,一个单词可能被标记为多个实体,从而使LUIS或其他原因造成混淆)。

您是否可以共享模型的JSON?

如果没有,那么给出当前信息的最佳答案将是遵循文档中概述的best practices,特别是迭代构建和测试,而不是一次添加成千上万的发音-它可以可能是导致您看到输出的鸡尾酒行为的几个冲突规则!

此外,请确保访问LUIS应用程序的“查看终结点话语”部分,并利用LUIS的active learning来提高收到的结果的质量。通过积极学习,

  

LUIS检查所有端点话语并选择符合以下条件的话语:   这是不确定的。您可以标记/训练/发布到的这些话语   更准确地识别语音。

答案 1 :(得分:0)

MS LUIS ...按下面的顺序工作...希望这可以给您一些想法。

  • 首先,它将从用户输入中识别所有适用的实体
  • 第二,它将过滤掉所有意图,但保留那些 具有匹配的实体
  • 第三,它将根据其他条件进一步过滤出意图 用户输入中匹配的单词(不是实体)
  • 最后,它将为意图分配置信度,并获得 输出

话语过多可能会导致您面临的问题。使用符合意图的图案,可以以更高的精度减少所需的发声次数。需要在这里有所创意。