如何使用GATE的众包插件将数据加载到CrowdFlower的工作中?

时间:2015-10-13 08:40:50

标签: gate crowdflower

我正在尝试使用CrowdFlower创建一个作业 GATE众包插件。我的问题是我无法将数据加载到 工作。到目前为止,我在创造这项工作时所做的是:

  1. 在PR中创建作业构建器。

  2. 右键单击作业构建器,然后选择创建新的CrowdFlower 工作。这份工作出现在CrowdFlower的工作清单中。

  3. 用一些文档填充语料库,用一些文档预处理它们 ANNIE的申请,例如标记器和句子分割器

  4. 将作业构建器添加到语料库管道,编辑一些参数 它们与初始注释(代币和句子)匹配

  5. 运行管道。 (当然,我确保工作ID匹配)

  6. 完成所有这些后,作业仍然有0行数据。我想知道是否 我做错了,因为我确信我会按照this tutorial上的所有说明进行操作,特别是第28页到第35页。对此我有什么建议吗?

1 个答案:

答案 0 :(得分:1)

我敢打赌你在其中一个作业构建器运行时参数中输入了拼写错误:)

仔细检查注释和注释集的名称,确保文档中存在所有注释和注释集。如果它们存在且构建器找到它们,则每个实体注释都应出现cf _..._ id特征。

如果作业构建器找到任何注释,它将调用crowdflower API并在无法上传数据时抛出异常。这听起来似乎没有发送任何请求,我看到的唯一原因是它无法找到注释。