当我将双列文本图像传递给google cloud vision API的TEXT_DETECTION / DOCUMENT_TEXT_DETECTION时,双列文本的输出不是正确的顺序,因为它从第一列开始一行,然后从另一列开始下一行并附加它。
您可以看到输出的结果未按照双列的顺序正确对齐。有没有办法纠正谷歌视觉API的结果,或使用JSON文件输出纠正它?
To view input image in JPG[click here]
输出 -
6.6医疗保健访问时间。 [56]他们的视力受损可以用它来识别附近的peo-6.6医疗保健服务 没有他们说一句话.152 ||视力障碍有能力 为健康和福祉创造后果。视力障碍是 特别是在老年人中增加。人们认识到那些 6.5.3视力障碍的沟通发展个人可能有限地获得信息和医疗保健 设施和视觉障碍会对de- 可能没有得到最好的照顾,因为不是所有的发展 婴幼儿沟通。兰医疗保健专业人员是 了解儿童或儿童的具体需求记录和社会发展 婴儿可以选择视力。由于无法看到而非常拖延 他们周围的世界。 。有效保健的先决条件是 很好地让员工知道人们可能有问题 有远见。社会发展社会发展包括 - 与传播中的婴儿周围的人们的戏剧 以及能够开始生活的不同方式。给一个孩子 有远见,微笑与视障人士沟通 客户必须是父母是承认和沟通的第一个象征 根据个人需求量身定制,适用于所有阳离子,并且是 几乎是即时沟通的因素。对于视障人士 婴儿,父母的声音将被注意到 大约两个月大,但微笑只会被唤起 7流行病学家长和婴儿之间的接触。这种主要形式 孩子的沟通会大大延迟,并会阻止其他人 发展中的沟通方式。社会互动世卫组织 估计2012年有2.85亿更复杂 因为微妙的视觉线索是错误视觉障碍的人 世界上,有246万人和其他人的面部表情 丢失。狮子视力低下,有3900万人失明。[4]由于延误 在儿童的沟通发展中,盲人90% 生活在发展中,他们似乎对社会不感兴趣 与世界的活动。 [56]全世界每个盲人,平均 如何对3.4人进行同伴,非交际和非教育 视力低下,国家和地区与其他人沟通。 这可能导致儿童变异范围从2.4到5.5。[57]成为 由同龄人避免并因此过度保护按年龄:视觉 家庭成员不平等地分配减值。跨年龄 组。所有盲人中有82%以上是50岁 虽然他们只代表世界上19%的人口,但他们年龄更大 人口。由于视觉发展与视线很多 在盲人(盲人年)生活的年数,学习 通过模仿他人,儿童失明来学习孩子 仍然是一个重大问题,视障儿童在哪里 估计需要140万以下的盲童 15岁。针对推迟发展的imi的发展 性别:可用的研究始终如一地表明了这一点。一个 视力受损的婴儿可能会唠叨和模仿每个地区 世界上,在所有年龄段,女性的言论都比视力更快 孩子,但可能显示延迟明显更高的视觉风险 孩子可能会比在结合单词说话时受损 男性。倾向于提出几个问题,他们使用形容词是 罕见。通常,孩子的感官体验是按地理位置划分的: 视觉障碍不会随时分配,也不会轻易编码 语言,这可能会在全世界形成它们。更多 超过90%的存储短语和句子在他们的记忆和重新 世界视障者生活在发展中国家。 [57]泥炭他们 你离题了。盲童的语言自估计以来 20世纪90年代,基于这一点的新数据似乎并未反映出他们的观点 发展2002年全球人口的知识显示减少了 数字世界,而不是他们的语言知识 盲人或视力受损的人,以及其他人。谁是 盲目免受传染病的影响,但A视力受损 孩子也可能犹豫不决,探索增加的数量 由于害怕这些人而对周围世界失明的人 未知和与更长寿命相关的条件。 157 ||也可能是 不受过度保护的探索 - 1987年,据估计 那个家庭成员中有598,000人。没有具体 经验,美国符合盲目的法律定义。 孩子是不是能够发展有意义的概念或这个 数字,58%超过65.581岁。用1994年语言来形容 或者想一想。 55] 1995年,130万美国人报告合法 失明。 159 |
答案 0 :(得分:1)
Google OCR没有自动列或任何其他格式检测。
由您来正确解释单词及其边界框坐标。如果你知道页面格式,这很容易。但如果你不这样做,这对于任意文件来说都是一个非常难以解决的问题。
答案 1 :(得分:0)
您可以使用DOCUMENT_TEXT_DETECTION查找不同的块/段落,然后通知Armonize。
请在此处找到文档的完整参考: https://cloud.google.com/vision/docs/ocr