如何将wit.ai与现有数据行一起使用?

时间:2016-06-13 21:18:54

标签: chatbot wit.ai facebook-chatbot

我有很多现有的数据,我想用作wit.ai聊天机器人的训练数据。数据存储在csv文件中,其中每行都有一个语句/问题以及对该语句/问题的响应。

我知道wit.ai要求你为意见分配意图,所以我想知道是否有办法简单地发送我拥有的数据并让聊天机器人自己开始学习意图。

谢谢!

2 个答案:

答案 0 :(得分:2)

感谢发帖。我们知道这还不完美,但几天前我们发布了导入/导出功能。查看json导出的结构,可以轻松地使用现有数据。这需要在每个陈述/问题和回复中创建一个故事。更多信息: https://wit.ai/docs/recipes#copyexportversion-my-app

答案 1 :(得分:1)

“教学”Wit.Ai并不是人们可能认为的那样。

您必须为User says列创建故事。回答与诚实无关。你不能“教”wit.ai回复。回复在故事或代码中定义。

您的数据可能需要的是关键词和关键词,这些词使得实体识别能够更好地发挥作用。

这是最简单的例子:

enter image description here

根据列出的关键字识别实体color。因此,如果您有大量数据作为用户输入的示例 - 您可以尝试首先将其分解为“用户输入应该生成哪些实体”,然后是这些输入中的关键字。

将您的数据用于“教学” - 会有点困难,因为它需要您在wit.ai中创建大量故事,以涵盖可能的用户输入和实体识别。但你仍然可以这样做:

(粗略的例子)

  1. 制作一个关于用户询问时间的故事
  2. 在用户输入中标记应从该输入派生哪些实体: enter image description here
  3. 对列表进行排序,以获得所有可能的时间要求:
    • 有多晚了?
    • 你能告诉我时间吗?
    • 我想知道现在是什么时候?
  4. 使用脚本(Python)在您的故事中“拍摄”所有这些用户输入。
  5. 完成后 - 转到了解wit.ai的时间并通过所有输入更正\添加您定义的实体。
  6. 如果实体是基于关键字或其他算法,则此过程将“教授”实体。

    这是我能想到的关于如何使用现有数据的最佳方法。 Wit.Ai与其他语言处理工具集不同,并且用现有数据“教学”它有些“令人费解”:)