应用错误收集

LUIS - 微软认知服务短语列表功能，将短语识别为实体

时间：2016-06-23 14:04:55

标签： bots chatbot microsoft-cognitive luis

LUIS是一个很棒的工具。我们开始着手编写聊天机器人，我们想要使用LUIS服务。我们希望LUIS从给定文本中识别各种Microsoft产品。

让我们说，我希望LUIS识别sharepoint 2010，sharepoint 2013，visual studio 2013，visual studio 2010＆＃34;等作为技术产品。我们尝试添加＆＃34;产品＆＃34;功能和添加的昏迷分隔值，如上所示。然而，该模型只支持sharepoint，visual - 基本上是单个单词。它无法识别短语。

在对一些数据进行培训后，它能够将sharepoint和visual识别为技术（实体），但是，根据需要，整个短语不起作用。

然后我们切换到简单的RegEx，这个(SharePoint)\s*(2013|2007|2010)非常直接。它仍然无法将其识别为单个短语。

有人可以帮我吗？

2 个答案:

答案 0 :(得分：1)

快速更新...我能够获得正确的逻辑，使模型能够理解“SharePoint 2013”整体上是一个产品。但是，在给出相同的上下文后，它无法预测任何其他不在“短语列表功能”中的产品。

我一直在训练“我在BizTalk上工作”，“我在SQL上工作”....（所有单字母单词），一旦它开始正确地预测单个字母“技术/产品”。我给了话语作为“我在Sharepoint 2016上工作”，然后它只预测“SharePoint”作为产品。然后我添加了所有成功的单字产品，随之而来的是我给了“SharePoint 2016”和宾果游戏......它有效。

到目前为止一直很好......

这是棘手的事情，现在该模型对于上下文的模式以及各种产品的命名方式已经相当稳定，我希望它能够预测“我在Exchange 2016上工作”，不幸的是它不起作用。它只预测“交换”作为产品。然后我用相同的上下文（“我在YYYY上工作”）训练了很多项目。至少现在，模式匹配算法应该理解模式。当把话语作为“我在Visual Studio 2016上工作”时，它未能预测“Visual Studio 2016”是该产品。它只预测“Visual Studio”作为产品。现在请注意，在短语中我还添加了“Visual Studio”，“Visual Studio 2013”，“Visual Studio 2010”并经过培训并正在成功预测。如果它现在无法预测“Visual Studio 2016”是一个产品????我应该在短语列表中添加多少这样的产品？现在AI怎么样？

理念基于上下文，并且应该能够轻松地预测其余的“产品”。我错过了什么？

答案 1 :(得分：0)

我与LUIS面临着类似的学习曲线。根据您的需要，您应该使用简单实体。我发现你必须为你想要的每个单词变化训练至少3个单词。因此，如果您尝试接收的实体可以包含1到5个单词，则每个短语需要15个发音。所以那是15“我曾经研究过这样的”短语。如果你还想要另一个短语，比如“我知道如何使用这样的短语”，你至少需要另外15个单词。简而言之，你需要很多话语。而且我也经历过，如果你的实体混合了诸如“2017”或“三”之类的数字，或者像“of”，“for”，“for”等词，你可能需要额外的话语。在您的情况下，您至少需要以下内容：

我在工作室工作我在视觉上工作我在2017年工作我在视觉工作室工作我参与了2017年的展望我从事假申请我在微软视觉工作室工作我在2017年的单词文件上工作我在Skype上工作我在谷歌地图计步器应用程序上工作我从事应用程序的visual basic工作我从事过计算机应用培训信息我在大型小船帆上工作我工作了一两三四五我在绿蓝红橙黄色上工作

明白了吗？确保在每个话语中标记实体。

此外，如果您有相似但不同类型的短语，则可以使用LUIS的短语列表功能，而不是另外输入15个项目。所以，假设您也想要“我知道如何使用......”只需创建一个名为“我工作过”的短语列表，并添加短语列表，例如：

我工作了我知道怎么用我很高兴我很高兴我很擅长我是最好的 ...等