应用错误收集

Watson Assistant掩盖了许多ML / NLP技术。因此，这不仅仅是一个算法。了解它们并不会帮助您改善结果。

我想改善ibm的Watson助手结果。

有很多方法。

代表性问题。

着重于从最终用户那里获得真正的代表性问题。不仅使用他们使用的语言，而且还尽可能使用计划在其上使用WA的媒体（例如，移动设备，Web，音频）。

这是降低准确性的第一个因素。制造意图可能意味着您建立了一个客户可能从未问过的意图（即使您认为他们这样做了）。其次，您将使用类似模式的语言/术语。这使得WA难以训练。

可以通过一个问题来训练意图，但是为了获得最佳结果，可以回答10-20个示例问题。如果意图紧密相关，则需要更多示例。

当前过程是创建所谓的K折交叉验证（sample script）。如果您的问题具有代表性，那么结果应为您提供一个准确的指标，表明其效果如何。

但是，可能会过度适合该培训。因此，您应该使用盲目设置。这是所有问题的10-20％（随机样本）。绝对不要将它们用于训练WA。然后针对系统运行它们。盲注+ K折应都落在5％之内。

您可以查看K形折叠的结果以解决问题，但盲目设置则不然。百叶窗也可能过时。因此，尝试在2-3个训练周期后创建一个新的盲注集。

无论您的系统培训得如何，我都可以保证当在最终用户面前出现新事物时，会弹出。因此，您应该计划让用户进行测试，然后再将其投入生产。

让用户进行测试时，请确保他们了解接受培训的一般领域。您可以使用用户故事来做到这一点，但请尽量避免使用户提出范围狭窄的问题。

示例：