我目前正在使用C#开发最新版本的Tesseract OCR库。我有一个Adaptive Thresholding的实现,与Tesseract在其预处理步骤中使用的二进制阈值相比,它能更好地将文档转换为黑白图像。当我使用的是静态链接的tesseract库时,我想一起禁用所有预处理,并通过C#应用自己的预处理步骤,然后再将其传递给Tesseract作为一个整体,包括偏斜校正。
话虽这么说,有什么办法可以消除Tesseract中所有的预处理步骤。即使我可以从操作中整体删除 Liptonica 并在传递图像之前应用自己的预处理,也会更好。