私人团队的AWS Sagemaker Ground Truth WorkerID

时间:2019-05-03 09:57:36

标签: amazon-web-services amazon-cognito amazon-sagemaker

我已经建立了一个AWS Sagemaker地面真相标签项目,并且正在使用一个私人团队进行这项工作。我想跟踪团队中的哪个成员给出每个答案。

唯一的用户特定信息是workerId,例如here

sagemaker文档没有有关此ID的任何信息,在cognito文档中也没有任何信息,我需要使用它来管理工人团队。

据我所知,workerId是与mturk相关的ID。 workerId出现在数据结构here中。

我的问题是如何将workerId映射到我的认知组中的特定用户?没有这样做的能力,该项目将无法正常工作。

2 个答案:

答案 0 :(得分:2)

创建一个简单的自定义批注作业,在该作业中,您要求每个注释者提供其用户名/电子邮件/全名/任何内容。该注释作业的结果将允许您映射workerId,以便您可以从私人劳动力中识别个人

答案 1 :(得分:0)

实际上,这可以通过编程实现,而无需依靠工人报告其身份-我遇到了同样的问题,发现了以下问题:

  1. Sagemaker Ground Truth会自动记录工人的行动。它记录的内容包括您熟悉的workerIdcognito_user_pool_idcognito_sub_id(看看track worker performance docs

  2. workerId是特定于地面真理的且不透明,因此无法通过地面真理告诉您workerId映射到哪个Cognito用户。但是,Cognito用户is uniquely mapped to by its sub id

  3. 您可以利用using the cognito sub id to query the cognito username利用日志的workerIdcognito_sub_id配对来生成映射(请务必阅读答案列表-接受的人说这是不可能的,但是已经过时了。

您可以使用上面的映射来维护workerId - cognito sub id - username三胞胎的数据库,并在需要确定workerId属于哪个用户时使用该数据库。请注意,这意味着您第一次在“地面真理”工作中看到workerId时,将无法找到其映射。如果这是一个问题,您实际上可以通过使用前面建议的一次性工作来解决。该作业的日志将包含您需要的映射。