找不到图像文件

时间:2017-07-02 08:50:00

标签: ocr tesseract

通过Homebrew,我在Mac上安装了Tesseract OCR引擎。所有目录(jpegleptonicalibpnglibtiffopenssltesseract)现已安装在/usr/local/Cellar < / p>

在将图像放入Cellar目录之前,当我在命令行中尝试以下操作时,显然它会失败:

$ tesseract image.png outcome

因此,由于没有这样的图像,我收到以下错误消息:

Error in fopenReadStream: file not found
Error in findFileFormat: image file not found
Error during processing.

生成这些消息的程序 / 脚本在哪里?我只能在已安装的Tesseract目录中找到include个文件...如果找不到图像,那么包含这些错误消息字符串的文件在哪里等??

此外,执行图片 预处理脚本 / 计划在哪里(例如分割,二值化去除噪声等...)

上下文/背景

我们计划根据我们的需求改进(而非定制)Tesseract(例如识别产品的序列号和车牌号)但显然首先我们需要知道什么样的过滤阈值默认情况下,Tesseract会执行。

我理解Tesseract在进行实际OCR之前在内部(使用Leptonica库)执行各种图像处理操作。例如,我了解Tesseract内部进行二值化和分段和噪声消除,以及使用默认分段方法。这是正确的吗? 哪些脚本包含这些方法,以便在执行实际OCR之前,我可以看到这些内部图像处理操作的执行顺序是什么?

github下载有很多目录和代码,所以我真的很感谢有人指出我们正确的方向 - 我们应该看看Tesseract在进行实际OCR之前所做的标准参数和图像处理操作。我们只能找到.h个头文件...

谢谢,

0 个答案:

没有答案