应用错误收集

tesseract ocr multipage pdf挂起

时间：2011-07-12 06:10:57

标签： pdf ocr tesseract multipage

我们正在使用Tesseract的Java库，称为Tess4j，将PDF文件转换为文本。它与Tiff文件以及一页PDF文件很好地配合使用。但是对于多页PDF，它会生成输出文件，当涉及到最后一页时，控件似乎没有回到调用doOCR调用的原始应用程序。只是在没有做任何事情的情况下停留在那里。这是一个本机调用没有返回的问题。我没有任何线索，

如果有问题，请尽快通知我。

问候
Vish

1 个答案:

答案 0 :(得分：0)

Tess4J支持多页PDF和多页TIFF。用单元测试用例中的PDF文件替换并试一试。

tesseract ocr multipage pdf挂起
tesseract v3.03使用可搜索的文本示例呈现PDF
tesseract（v3.03）输出为PDF
Tesseract ocr PDF作为输入
使用PHP Imagick / Tesseract将OCR多页PDF作为多页TIFF
使用多重tiff进行Tesseract训练
无法使用tesseract
ImageMagick和Tesseract（PDF至TIFF至PDF）尺寸问题
使用pytesseract从图像生成PDF
如何从pdf / image中检测特殊符号？

我写了这段代码，但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？
是否有可能使 loadstring 不可能等于打印？卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用？
在此代码中是否有使用“this”的替代方法？
在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源？