应用错误收集

不同的服务都将为光学字符识别（OCR）提供不同级别的抽象，具体取决于您最喜欢使用管道的哪些部分以及您希望抽象的部分。

以下是一些选择：

识别将为开箱即用的OCR提供DetectText功能。但是，您似乎需要在当前情况下对图像执行某种预处理，以便获得更好的结果。可以通过您选择的任何方法（Lambda，EC2等）完成此操作。
SageMaker 是一个工具，可让您轻松训练和部署自己的模型（任何类型）。 SageMaker有两个主要选项：
1. “自己动手”选项：如果您打算采用标记自己的数据，收集可观的训练集并训练自己的OCR模型的路线，这就是可以通过SageMaker训练和部署自己的模型来实现。
2. 现有的OCR算法：目前有许多算法对于OCR具有不同的潜在折衷。一个示例是Tesseract。使用此功能，您可以将预处理步骤与文本检测更紧密地结合在一起。
Amazon Textract（在预览中）是一种专用的专用OCR服务，根据您的图像外观和选择的设置，它可能会提供更好的性能。

我个人建议使用pre-processing for OCR来看看它是否可以提高识别精度，然后再使用其他选项。即使它不能提高Rekognition的准确性，它对于其他大多数选项还是很有价值的！