我是新的LUIS AI
我想为想要在线购书的机器人用户培训路易斯。可以输入I want XYZ
,其中XYZ是书或I want ABC
,其中ABC是作者。
他们可以撰写find
,find out
,search
,searching
,looking
,would like to see
,would like to find
或他们想写的任何内容。
我的要求是从带有话语和实体的excel表开始,当我上传它时,点击火车,应该训练应用程序足以处理所有这样的用户输入,至少90%。
这里的问题是我应该如何编写话语来处理巨大的用户输入概率。我已经有大约65个话语,其中包括相关和多样的话语,但仍然没有接受过训练来处理所有用户输入。
请建议我如何处理话语以满足此要求。
答案 0 :(得分:0)
科学家通常需要30分钟的谈话或200个话语作为进行研究的足够好的样本[1]这是一个数量级的估计值,这是一个很好的知识和比较自己。
现在,为了获得传入话语的最大可变性,必须找到类似请求的良好来源。对于我的情况,像雅虎答案的网站非常适合找到我工作主题的通常请求结构。我建议你找一个人们用类似目标查询的地方:Google adwords helper是一个普遍但可靠的开始。
[1] http://www.scielo.br/scielo.php?pid=S1516-18462015000401143&script=sci_arttext&tlng=en