使用大型数据集训练对话流

时间:2019-01-10 13:30:40

标签: python python-3.x dialogflow chatbot

我有包含用户查询和响应的数据集。数据集的大小约为〜5万。数据存储在csv文件中,该文件具有两列分别用于查询和响应。如何使用此数据集训练对话流?我可以使用python API进行训练吗?在他们的文档https://dialogflow.com/docs/training-analytics/training中提到了它。但是我不知道该怎么训练?我想这样训练-https://miningbusinessdata.com/reader-question-automating-dialogflow-training/。但是我无法完全理解该怎么做。

1 个答案:

答案 0 :(得分:1)

您可以仅上传包含用于培训的用户查询列表的TXT文件。 here中描述了该过程。一种替代方法是使用REST界面来更新意图,并通过batchUpdate将训练数据作为示例调用添加,或使用导出/导入来添加训练短语(我没有尝试过此选项)。

  1. 用于TXT上传:您无法上传回复,回复将由当前培训自动确定。

    • 上传txt文件,每个用户请求各占一行(没有其他标记,也没有响应)
    • 切换到“培训”菜单,然后点击上传的对话,您将看到用户请求列表
    • 检查用户请求是否与正确的响应相匹配,如果不正确,请更正
    • 顶部有一个按钮来接受结果,代理将根据新数据进行训练
  2. 用于批量上传或导出/导入 您提到的训练功能仅仅是开始训练的功能,而不是添加训练数据的功能。但是,您可以使用bach上传来添加意图,包括示例调用。

    • 这是HTTP请求格式 POST https://dialogflow.googleapis.com/v2/{parent=projects/*/agent}/intents:batchUpdate
    • 以URI或内联方式提供批次。您应该可以使用updateMask来更新训练短语
    • 文档中有更多详细信息,但是如果您使用内联,则会发送一个intentBatch,其中包含一个intent列表,每个intent看起来像this
    • 您还可以先导出项目,在自动脚本中添加训练短语,然后使用projects.agent.import(see more here)再次导入项目