我有很多现有的数据,我想用作wit.ai聊天机器人的训练数据。数据存储在csv文件中,其中每行都有一个语句/问题以及对该语句/问题的响应。
我知道wit.ai要求你为意见分配意图,所以我想知道是否有办法简单地发送我拥有的数据并让聊天机器人自己开始学习意图。
谢谢!
答案 0 :(得分:2)
感谢发帖。我们知道这还不完美,但几天前我们发布了导入/导出功能。查看json导出的结构,可以轻松地使用现有数据。这需要在每个陈述/问题和回复中创建一个故事。更多信息: https://wit.ai/docs/recipes#copyexportversion-my-app
答案 1 :(得分:1)
“教学”Wit.Ai并不是人们可能认为的那样。
您必须为User says
列创建故事。回答与诚实无关。你不能“教”wit.ai回复。回复在故事或代码中定义。
您的数据可能需要的是关键词和关键词,这些词使得实体识别能够更好地发挥作用。
这是最简单的例子:
根据列出的关键字识别实体color
。因此,如果您有大量数据作为用户输入的示例 - 您可以尝试首先将其分解为“用户输入应该生成哪些实体”,然后是这些输入中的关键字。
将您的数据用于“教学” - 会有点困难,因为它需要您在wit.ai中创建大量故事,以涵盖可能的用户输入和实体识别。但你仍然可以这样做:
(粗略的例子)
如果实体是基于关键字或其他算法,则此过程将“教授”实体。
这是我能想到的关于如何使用现有数据的最佳方法。 Wit.Ai与其他语言处理工具集不同,并且用现有数据“教学”它有些“令人费解”:)