准备培训示例Watson Assistant

时间:2019-02-06 09:57:23

标签: machine-learning ibm-cloud watson-conversation

我使用Watson Assistant对客户的电子邮件进行分类。

我阅读了有关创建意图Best practices for creating intents/entities with IBM Conversation Service的最佳做法的很好的答案。它给了我一些如何改善结果的想法。

但是,我有一个关于在将示例添加到Watson之前清理示例的问题。

我必须删除所有数字,姓名,日期等吗?我是否必须删除“您好,谢谢,等待您的回复……”之类的短语?

例如,初始电子邮件为:

  

你好,我将搬到另一个城市,我的地址将在4月21日之后更改。我的新地址将是伦敦,ABC Street 123,应用程序。 34.您可以在我的配置文件中对其进行更新吗?预先谢谢你。真诚的,马克

“已清除”电子邮件

  

我要搬到另一个城市,我的地址也会改变。我的新地址将是

我必须删除所有不必要的信息,还是最好在Watson中添加初始短语?

您知道Watson Assistant使用什么算法进行分类(意图)?

预先感谢您的任何答复。

1 个答案:

答案 0 :(得分:1)

您不应培训PII信息。它不会为您的模型增加任何价值。如果存在与数据相关的审核,这也会带来风险。例如GDPR。

找到邮件意图的本质并对此进行培训。

您的示例是他们想更新其个人资料。


请注意,WA并非旨在对电子邮件进行分类。因此,您可能需要设计一种对每个句子评分的机制,或处理电子邮件中的多个意图。

另一个选项是Watson NLC,我已将其用作邮件分类器。


您还应尝试减少存储在Watson Assistant中的PII,尽管它符合PII并支持GDPR。