Google Cloud Vision API是否支持从具有梳状字段的pdf /图像中读取手写或键入的文本

时间:2019-01-02 14:57:36

标签: google-cloud-vision

我正尝试从具有梳状字段的表单中读取手写或键入的文本,如下图所示

test image with comb fields

我尝试使用Cloud Vision API读取PDF和手写OCR(DOCUMENT_TEXT_DETECTION / TEXT_DETECTION类型),但未返回正确的数据。字段分隔符(|)读为I 所以, Google Cloud Vision API是否支持从具有 comb字段的pdf /图像中读取手写或键入的文本? 要么 阅读文字之前,是否可以选择模糊或去除字母之间的管道?

2 个答案:

答案 0 :(得分:0)

在Vision API请求中没有选项/参数可以指定梳状字段。为了改善手写识别的效果,我建议对图像进行预处理以去除梳状区域。而且由于Vision API不适合预处理图像,因此在这种情况下,您将必须自己进行处理,这需要其他编码。您可以尝试做的一件事是,如果文本和梳状字段的颜色是不同级别的黑色或不同颜色,则应用一种称为Thresholding的方法。另一个可能的选择是使用梳理字段拍摄相同的图像,但不使用手写文本,然后执行减法运算,这将导致图像仅包含手写文本。

答案 1 :(得分:0)

OCR有一种变体,称为智能字符识别(ICR),可以与之完全兼容。这些框实际上使识别起来更容易。