应用错误收集

Google Cloud Vision API是否支持从具有梳状字段的pdf /图像中读取手写或键入的文本

时间：2019-01-02 14:57:36

标签： google-cloud-vision

我正尝试从具有梳状字段的表单中读取手写或键入的文本，如下图所示

我尝试使用Cloud Vision API读取PDF和手写OCR（DOCUMENT_TEXT_DETECTION / TEXT_DETECTION类型），但未返回正确的数据。字段分隔符（|）读为I 所以， Google Cloud Vision API是否支持从具有 comb字段的pdf /图像中读取手写或键入的文本？要么阅读文字之前，是否可以选择模糊或去除字母之间的管道？

2 个答案:

答案 0 :(得分：0)

在Vision API请求中没有选项/参数可以指定梳状字段。为了改善手写识别的效果，我建议对图像进行预处理以去除梳状区域。而且由于Vision API不适合预处理图像，因此在这种情况下，您将必须自己进行处理，这需要其他编码。您可以尝试做的一件事是，如果文本和梳状字段的颜色是不同级别的黑色或不同颜色，则应用一种称为Thresholding的方法。另一个可能的选择是使用梳理字段拍摄相同的图像，但不使用手写文本，然后执行减法运算，这将导致图像仅包含手写文本。

答案 1 :(得分：0)

OCR有一种变体，称为智能字符识别（ICR），可以与之完全兼容。这些框实际上使识别起来更容易。