Amazon Textract与Amazon Rekognition DetectText

时间:2019-05-06 15:34:21

标签: amazon-web-services amazon-rekognition amazon-textract

如何确定何时使用Amazon Textract和Amazon Rekognition的TextDetect方法?

我的用例是从移动设备中单击图片,然后将图像数据转换为文本并存储到AWS RDS中。

2 个答案:

答案 0 :(得分:3)

在端到端问题解决方面,Textract将表现得更好,因为它在OCR中具有更全面的功能。

Textract是一种较新的AWS服务,它是为解决图像(和PDF)中的OCR(光学字符识别)问题的专用解决方案而创建的。 Rekognition是一种更通用的计算机视觉服务,而Textract具有更多面向OCR的调整参数,可优化准确有效地提取文本的过程。

开箱即用,如果您要做的就是检测文本和相关的元数据(坐标,角度,置信度值),则Rekognition DetectText方法的性能可能与等效的{{1} }方法,但是Textract提供了进一步的自定义功能,可以帮助文本策划/格式化来抽象化开发人员传统上需要自己编写的其他形式的后处理。

注意:截止到今天(19/5/6),analyze_document仍处于预览阶段,因此,还需要考虑其他因素。具体取决于您需要多快的时间来构建您的解决方案。 / p>

答案 1 :(得分:1)

如果图片中仅包含随机文本,请使用 Amazon Rekognition 。它将在任何位置找到文本。

Amazon Textract 设计用于将纸质文档转换为有组织的数据

>随机图片可能无法很好地工作(尽管我没有尝试过,所以我不确定!)。