我正在尝试创建一个聊天机器人。所有的聊天机器人都是由结构数据组成的。我看了 Rasa,IBM watson 和其他著名的机器人。有什么方法可以将非结构化数据转换为某种可以用于机器人培训的结构?让我们考虑下面的段落-
Packaging unit
A packaging unit is used to combine a certain quantity of identical items to form a group. The quantity specified here is then used when printing the item labels so that you do not have to label items individually when the items are not managed by serial number or by batch. You can also specify the dimensions of the packaging unit here and enable and disable them separately for each item.
It is possible to store several EAN numbers per packaging unit since these numbers may differ for each packaging unit even when the packaging units are identical. These settings can be found on the Miscellaneous tab:
There are also two more settings in the system settings that are relevant to mobile data entry:
When creating a new item, the item label should be printed automatically. For this reason, we have added the option ‘Print item label when creating new storage locations’ to the settings. When using mobile data entry devices, every item should be assigned to a storage location, where an item label is subsequently printed that should be applied to the shelf in the warehouse to help identify the item faster.
如何利用此类数据使机器人成为潜在客户,将受到高度赞赏。谢谢! 图片中的这个想法行得通吗?just_a_thought
答案 0 :(得分:1)
您显示的数据似乎是进行段落搜索的不错选择。基本上,您想通过在培训数据中找到的最相关的段落来回答用户问题。此用例由Watson Discovery服务处理,该服务可以在您提供时分析非结构化数据,然后可以使用输入文本查询服务,并使用数据中最接近的段落查询服务答案。
根据我的经验,通过实现针对您的用例量身定制的自定义TF/IDF算法(TF / IDF是一种很好的相似性搜索,例如针对您的停用词),您也会获得不错的结果。
现在,如果您的目标是使用这些数据来引导基于规则的聊天机器人,那么这些数据就不是那么理想了。对于基于规则的聊天机器人,最好的数据将是用户之间的实际对话,这些对话是关于目标域的问题和某些主题专家的答案。使用这些数据,您可能至少可以进行一些分析,以帮助您确定聊天机器人应处理的相关主题和领域,但是-我认为-您将很难使用这些数据来引导一组意图(用户将遇到的问题问)基于规则的聊天机器人。
TLDR 如果我想使用Watson服务,我将从Watson Discovery开始。或者,我将从TF / IDF开始实施我自己的搜索算法(该算法很好地映射到您提出的解决方案)。