如何确定何时使用Amazon Textract和Amazon Rekognition的TextDetect
方法?
我的用例是从移动设备中单击图片,然后将图像数据转换为文本并存储到AWS RDS中。
答案 0 :(得分:3)
在端到端问题解决方面,Textract将表现得更好,因为它在OCR中具有更全面的功能。
Textract是一种较新的AWS服务,它是为解决图像(和PDF)中的OCR(光学字符识别)问题的专用解决方案而创建的。 Rekognition是一种更通用的计算机视觉服务,而Textract具有更多面向OCR的调整参数,可优化准确有效地提取文本的过程。
开箱即用,如果您要做的就是检测文本和相关的元数据(坐标,角度,置信度值),则Rekognition DetectText
方法的性能可能与等效的{{1} }方法,但是Textract提供了进一步的自定义功能,可以帮助文本策划/格式化来抽象化开发人员传统上需要自己编写的其他形式的后处理。
注意:截止到今天(19/5/6),analyze_document
仍处于预览阶段,因此,还需要考虑其他因素。具体取决于您需要多快的时间来构建您的解决方案。 / p>
答案 1 :(得分:1)
如果图片中仅包含随机文本,请使用 Amazon Rekognition 。它将在任何位置找到文本。
Amazon Textract 设计用于将纸质文档转换为有组织的数据。
>随机图片可能无法很好地工作(尽管我没有尝试过,所以我不确定!)。