我想改善ibm的Watson助手结果。 因此,我想知道确定Watson Assistant对话中对话的算法。 它是svm算法吗? 欢迎论文。
答案 0 :(得分:1)
Watson Assistant掩盖了许多ML / NLP技术。因此,这不仅仅是一个算法。了解它们并不会帮助您改善结果。
我想改善ibm的Watson助手结果。
有很多方法。
着重于从最终用户那里获得真正的代表性问题。不仅使用他们使用的语言,而且还尽可能使用计划在其上使用WA的媒体(例如,移动设备,Web,音频)。
这是降低准确性的第一个因素。制造意图可能意味着您建立了一个客户可能从未问过的意图(即使您认为他们这样做了)。其次,您将使用类似模式的语言/术语。这使得WA难以训练。
可以通过一个问题来训练意图,但是为了获得最佳结果,可以回答10-20个示例问题。如果意图紧密相关,则需要更多示例。
当前过程是创建所谓的K折交叉验证(sample script)。如果您的问题具有代表性,那么结果应为您提供一个准确的指标,表明其效果如何。
但是,可能会过度适合该培训。因此,您应该使用盲目设置。这是所有问题的10-20%(随机样本)。绝对不要将它们用于训练WA。然后针对系统运行它们。盲注+ K折应都落在5%之内。
您可以查看K形折叠的结果以解决问题,但盲目设置则不然。百叶窗也可能过时。因此,尝试在2-3个训练周期后创建一个新的盲注集。
无论您的系统培训得如何,我都可以保证当在最终用户面前出现新事物时,会弹出。因此,您应该计划让用户进行测试,然后再将其投入生产。
让用户进行测试时,请确保他们了解接受培训的一般领域。您可以使用用户故事来做到这一点,但请尽量避免使用户提出范围狭窄的问题。
示例: