如何使用Watson NLC Toolkit管理多个培训集

时间:2016-02-24 00:54:11

标签: ibm-watson nl-classifier

从我看到的情况来看,没有办法将多个训练集上传到新的Watson NLC工具中。我需要管理单独的训练集及其相关的分类器。我在这里缺少什么?

enter image description here

2 个答案:

答案 0 :(得分:2)

首选项:为您要使用的每组培训数据提供NLC服务实例,并分别为每个培训数据访问工具。

解决方法:目前,在一个NLC服务实例中管理多个培训集的流程如下:

  1. (可选择重新开始)转到训练数据页面并单击垃圾图标以删除所有训练数据。
  2. 使用上传图标在培训数据页面上传培训集。
  3. 根据需要操作数据。添加文本和类,使用类标记文本等。
  4. 创建分类器。创建分类器时,它实际上是当前训练数据的快照,因为您以后可以从分类器页面检索它。
  5. 根据需要重复步骤1-4,直到您上传了所有训练数据集并创建了相应的分类器。

    如果您想继续使用以前的训练集:

    1. 清除您的训练数据(上面的步骤1)。
    2. 转到分类器页面。
    3. 单击分类器的下载图标,其中包含您要使用的培训数据。
    4. 返回培训数据页面并上传从步骤3下载的文件。

答案 1 :(得分:1)

管理多个培训集的最佳方法是为每个培训集使用不同的NLC服务实例。

当前的Beta NLC工具并非旨在管理单个服务实例中的单独培训集。例如,当您添加没有类的文本时,该工具会提出建议 - 这些是基于最近训练的分类器,如果它基于完全不同的训练集,则无法理解。

如果您对由于某些原因可以使用的NLC服务的数量有严格限制,那么@John Bufe建议的解决方法将起作用,例如:您已达到Bluemix服务的限制。成本不是一个因素,因为额外的NLC服务实例不会增加总体价格,因为每月费用是针对受过训练的分类器实例。例如,如果您有四个服务实例,每个服务实例中只有一个分类器,您将看到3个充电和1个免费。

如果您想使用NLC beta工具来管理您的培训数据,我建议您为所需的每个培训集使用单独的NLC服务。