我有一个特定的意图,例如“昨天睡觉时你在梦什么”。标有标签的实体有梦,梦,睡觉和昨天。
但是,即使我测试了确切的短语,虽然它完全表达了意图,但它并不会提取所有实体,而只是提取“ what”部分。
正确标记了实体,所以我不明白为什么它不能提取它们。我在这里缺少一些最佳实践吗?
编辑:
我还应该补充一点,因为领域有很多重叠,所以我在数千个意图之间分配了数千个话语。我想知道这是否可能是一个问题-同一意图的更简单的言语(较少的实体)干扰了更复杂的言语(更多实体)?
编辑2:
我已经使用LUIS API设置了所有话语,并使用网站进行了培训和测试。
我只使用了一些简单的含义,例如“事实”,“观点”和“解释”。
只有15个实体,它们是简单的组,例如“情感”(伤害,爱,恐惧),“个人”(父亲,母亲,妹妹)和“食物”(汉堡,三明治)。
在所有这些意图中,都有成千上万的示例话。
如您所见,实体在发声中的位置有些复杂。同样,由于话语太多,我不知道LUIS是否会尝试选择最简单的话而忽略更复杂的话(也许这就是为什么它没有提取所有实体的原因?)
忽略其中一个实体被命名为“意图”,这只是该实体的方便名称。
答案 0 :(得分:0)
@ user9862995
我能够通过执行以下操作提取所有实体:
结果:话语中的所有4个实体都被提取
因此,鉴于您提供给我的信息,我现在可以看到的唯一区别是您添加的语音数量。很难准确地确定为什么在您的案例中未充分发现这些实体的原因(例如,一个单词可能被标记为多个实体,从而使LUIS或其他原因造成混淆)。
您是否可以共享模型的JSON?
如果没有,那么给出当前信息的最佳答案将是遵循文档中概述的best practices,特别是迭代构建和测试,而不是一次添加成千上万的发音-它可以可能是导致您看到输出的鸡尾酒行为的几个冲突规则!
此外,请确保访问LUIS应用程序的“查看终结点话语”部分,并利用LUIS的active learning来提高收到的结果的质量。通过积极学习,
LUIS检查所有端点话语并选择符合以下条件的话语: 这是不确定的。您可以标记/训练/发布到的这些话语 更准确地识别语音。
答案 1 :(得分:0)
MS LUIS ...按下面的顺序工作...希望这可以给您一些想法。
话语过多可能会导致您面临的问题。使用符合意图的图案,可以以更高的精度减少所需的发声次数。需要在这里有所创意。