使用Go将S3文档发送到Textract

时间:2019-06-22 22:18:13

标签: amazon-web-services go amazon-textract

我正在尝试使用Go将S3存储桶中的对象发送到Textract并收集响应。

我正在使用aws go sdk软件包,并且能够连接到我的S3存储桶并列出其中包含的所有对象。到目前为止,一切都很好。现在,我需要能够将这些对象之一(.pdf文件)发送到Textract并收集响应。

用于与Textract进行交互的AWS Go SDK内容似乎相当广泛,但我找不到如何做到这一点的好例子。

我非常感谢您提供样品或建议。

2 个答案:

答案 0 :(得分:0)

要开始工作,请使用StartDocumentTextDetection来调用DocumentLocation以指定文件,并指定SNS主题,Textract将在完成处理工作后在其中发布通知。 / p>

您现在有两种可能性:

  • 订阅SNS主题,当您收到一条消息时,检索结果
  • 创建由SNS主题触发的lambda函数,以检索结果。

第二个选择是IMO更好,因为它使用更少的计算时间(直到作业未完成才运行)。

要检索作业,请使用GetDocumentTextDetection

答案 1 :(得分:0)

如果其他人到达该网站以寻找答案:

我理解该文档,就好像可以通过textract SDK调用StartDocumentAnalysis函数一样,但实际上缺少的是需要首先创建一个新的Session并基于该Session进行调用的事实:

https://docs.aws.amazon.com/sdk-for-go/api/service/textract/#New