Goole OCR无法检测具有其结构的表

时间:2019-01-31 06:16:23

标签: ocr tesseract

我遵循了一个教程,并尝试使用Google OCR将图像转换为文本,我有一个表格,它的形式为“ Text value value value”,但是Google OCR的读法为

Text

Value

Value

Value

有没有办法按原样阅读?不会失去文字与价值的关系?

1 个答案:

答案 0 :(得分:1)

即使我也遇到了同样的问题。经过大量研究,我发现有一些称为表OCR的东西,而视觉api的TEXT_DETECTION和DOCUMENT_TEXT_DETECTION都不是表ocr的意思,它们不适合表格数据的复制,您需要大量的opencv要进行图像预处理。相反,您可以在互联网上使用表OCR API'(FREE),

请确保您的文本-值关系没有中断 他们OCR的输出 nutrifact data

将会

Nutrition fact blah blah boo Totalfat 0g 0%//in the same line Sodium 0mg 0%//in the same line ......... ..

因此,您可以将“ \ t”保留为分号并复制表格

希望我的回答会有所帮助:)