Google Cloud Vision - 无法使用2列文本

时间:2017-11-14 09:21:57

标签: android json google-cloud-platform ocr google-cloud-vision

当我将双列文本图像传递给google cloud vision API的TEXT_DETECTION / DOCUMENT_TEXT_DETECTION时,双列文本的输出不是正确的顺序,因为它从第一列开始一行,然后从另一列开始下一行并附加它。

您可以看到输出的结果未按照双列的顺序正确对齐。有没有办法纠正谷歌视觉API的结果,或使用JSON文件输出纠正它?

To view input image in JPG[click here]

输出 -

  

6.6医疗保健访问时间。 [56]他们的视力受损可以用它来识别附近的peo-6.6医疗保健服务   没有他们说一句话.152 ||视力障碍有能力   为健康和福祉创造后果。视力障碍是   特别是在老年人中增加。人们认识到那些   6.5.3视力障碍的沟通发展个人可能有限地获得信息和医疗保健   设施和视觉障碍会对de-   可能没有得到最好的照顾,因为不是所有的发展   婴幼儿沟通。兰医疗保健专业人员是   了解儿童或儿童的具体需求记录和社会发展   婴儿可以选择视力。由于无法看到而非常拖延   他们周围的世界。 。有效保健的先决条件是   很好地让员工知道人们可能有问题   有远见。社会发展社会发展包括 -   与传播中的婴儿周围的人们的戏剧   以及能够开始生活的不同方式。给一个孩子   有远见,微笑与视障人士沟通   客户必须是父母是承认和沟通的第一个象征   根据个人需求量身定制,适用于所有阳离子,并且是   几乎是即时沟通的因素。对于视障人士   婴儿,父母的声音将被注意到   大约两个月大,但微笑只会被唤起   7流行病学家长和婴儿之间的接触。这种主要形式   孩子的沟通会大大延迟,并会阻止其他人   发展中的沟通方式。社会互动世卫组织   估计2012年有2.85亿更复杂   因为微妙的视觉线索是错误视觉障碍的人   世界上,有246万人和其他人的面部表情   丢失。狮子视力低下,有3900万人失明。[4]由于延误   在儿童的沟通发展中,盲人90%   生活在发展中,他们似乎对社会不感兴趣   与世界的活动。 [56]全世界每个盲人,平均   如何对3.4人进行同伴,非交际和非教育   视力低下,国家和地区与其他人沟通。   这可能导致儿童变异范围从2.4到5.5。[57]成为   由同龄人避免并因此过度保护按年龄:视觉   家庭成员不平等地分配减值。跨年龄   组。所有盲人中有82%以上是50岁   虽然他们只代表世界上19%的人口,但他们年龄更大   人口。由于视觉发展与视线很多   在盲人(盲人年)生活的年数,学习   通过模仿他人,儿童失明来学习孩子   仍然是一个重大问题,视障儿童在哪里   估计需要140万以下的盲童   15岁。针对推迟发展的imi的发展   性别:可用的研究始终如一地表明了这一点。一个   视力受损的婴儿可能会唠叨和模仿每个地区   世界上,在所有年龄段,女性的言论都比视力更快   孩子,但可能显示延迟明显更高的视觉风险   孩子可能会比在结合单词说话时受损   男性。倾向于提出几个问题,他们使用形容词是   罕见。通常,孩子的感官体验是按地理位置划分的:   视觉障碍不会随时分配,也不会轻易编码   语言,这可能会在全世界形成它们。更多   超过90%的存储短语和句子在他们的记忆和重新   世界视障者生活在发展中国家。 [57]泥炭他们   你离题了。盲童的语言自估计以来   20世纪90年代,基于这一点的新数据似乎并未反映出他们的观点   发展2002年全球人口的知识显示减少了   数字世界,而不是他们的语言知识   盲人或视力受损的人,以及其他人。谁是   盲目免受传染病的影响,但A视力受损   孩子也可能犹豫不决,探索增加的数量   由于害怕这些人而对周围世界失明的人   未知和与更长寿命相关的条件。 157 ||也可能是   不受过度保护的探索 - 1987年,据估计   那个家庭成员中有598,000人。没有具体   经验,美国符合盲目的法律定义。   孩子是不是能够发展有意义的概念或这个   数字,58%超过65.581岁。用1994年语言来形容   或者想一想。 55] 1995年,130万美国人报告合法   失明。 159 |

2 个答案:

答案 0 :(得分:1)

Google OCR没有自动列或任何其他格式检测。

由您来正确解释单词及其边界框坐标。如果你知道页面格式,这很容易。但如果你不这样做,这对于任意文件来说都是一个非常难以解决的问题。

答案 1 :(得分:0)

您可以使用DOCUMENT_TEXT_DETECTION查找不同的块/段落,然后通知Armonize。

请在此处找到文档的完整参考: https://cloud.google.com/vision/docs/ocr