Tesseract OCR 3.0+ dll C#

时间:2012-08-02 10:58:01

标签: tesseract

我在google上找到了示例项目并下载了该项目并编译了示例.net项目。

  1. 是否有位置可以找到填充的tessdata文件夹或者我是否需要训练图书馆?正如我正在评估的那样,如果我能为英语找到预先填充的tessdata文件夹,我会更喜欢。

  2. 示例项目确实打开了我的示例jpeg文件,但它没有自动旋转。我想这可能是因为tessdata文件夹中没有文件。这是一个正确的假设还是tesseract dll应该在加载图像时执行自动旋转

  3. 我尝试打开灰度图像,但未能说明该像素不受支持。我找不到列出此类限制的任何文档。任何人都可以帮我核实一下吗?

  4. 基本上我希望自动轮换通过传真/扫描等方式传输的文档 - 所以如果有另一个我可以在C#项目中使用的开源替代方案,我也会接受这个想法。

  5. 更新1: 我明白了 tesseract on google

    启动cmd提示并使用follwowing

    启动tesseract.exe
    >tesseract.exe myimage.tiff -l eng 
    

    收到以下错误

    Tesseract Open Source OCR Engine v3.01 with Leptonica
    TIFFReadDirectory: Warning, TIFFstream: unknown field with tag 59932 (0xea1c) en
    countered.
    TIFFReadDirectory: Warning, TIFFstream: unknown field with tag 59932 (0xea1c) en
    countered.
    TIFFReadDirectory: Warning, TIFFstream: unknown field with tag 59932 (0xea1c) en
    countered.
    Page 0
    

    更新2: 解决了错误问题,但自动旋转似乎没有自动发生

0 个答案:

没有答案