我从tesseract得到的误差低于5+ MB的图像。
与Leptonica一起使用Tesseract开源OCR引擎v3.01 第0页 图像太大:(39667,56133) 处理过程中出错。
是否存在文件大小限制或是否存在解决此问题的参数。
感谢您的帮助..
答案 0 :(得分:13)
最大宽度和高度为32767。
从源代码(文件baseapi.cpp):
if (tesseract_->ImageWidth() > MAX_INT16 ||
tesseract_->ImageHeight() > MAX_INT16) {
tprintf("Image too large: (%d, %d)\n",
tesseract_->ImageWidth(), tesseract_->ImageHeight());
答案 1 :(得分:0)
这不是文件大小,而是超出Tesseract限制的图像大小(维度)。我对Tesseract识别16MB图像没有任何问题。尝试调整大小或重新缩放图像,然后重试。