我在google上找到了示例项目并下载了该项目并编译了示例.net项目。
是否有位置可以找到填充的tessdata文件夹或者我是否需要训练图书馆?正如我正在评估的那样,如果我能为英语找到预先填充的tessdata文件夹,我会更喜欢。
示例项目确实打开了我的示例jpeg文件,但它没有自动旋转。我想这可能是因为tessdata文件夹中没有文件。这是一个正确的假设还是tesseract dll应该在加载图像时执行自动旋转
我尝试打开灰度图像,但未能说明该像素不受支持。我找不到列出此类限制的任何文档。任何人都可以帮我核实一下吗?
基本上我希望自动轮换通过传真/扫描等方式传输的文档 - 所以如果有另一个我可以在C#项目中使用的开源替代方案,我也会接受这个想法。
更新1: 我明白了 tesseract on google
启动cmd提示并使用follwowing
启动tesseract.exe>tesseract.exe myimage.tiff -l eng
收到以下错误
Tesseract Open Source OCR Engine v3.01 with Leptonica
TIFFReadDirectory: Warning, TIFFstream: unknown field with tag 59932 (0xea1c) en
countered.
TIFFReadDirectory: Warning, TIFFstream: unknown field with tag 59932 (0xea1c) en
countered.
TIFFReadDirectory: Warning, TIFFstream: unknown field with tag 59932 (0xea1c) en
countered.
Page 0
更新2: 解决了错误问题,但自动旋转似乎没有自动发生