强制Google Cloud Vision从左到右,从上到下阅读文本

时间:2019-02-13 16:02:51

标签: node.js google-cloud-platform google-cloud-vision

我正在尝试自动化一组PDF文档的信息提取任务。我使用Cloud Vision的原因是文档受到保护,因此无法使用传统方法进行解析。这些文件是纯数字的,即没有印刷品,因此,字符识别可以正常工作。但是,这些单词的读取顺序并不符合我想要的确切顺序。为了让我能够像我想要的那样轻松地处理它们,我希望Cloud Vision 始终读取位于(或如果位于同一行,位于)左上方的单词另一个。

但是,我的实验并非如此。尽管这些文档之间的格式非常标准化,并且两个页面看起来几乎相同,但是它们的顺序可能相差很大。

我在请求中使用的功能类型为“ DOCUMENT_TEXT_DETECTION”,因为我知道这是我所遇到的最好的功能。是否有其他选项可以实现此目的(我正在使用Node客户端库)?

0 个答案:

没有答案