Tesseract:版本cf0b378和版本3.05.01之间的不同行为

时间:2017-09-26 07:45:46

标签: macos ocr tesseract

我最近将我的电脑从运行Ubuntu 16.04的电脑改为使用Mac OS X 10.12.6的MacBook Pro。 我正在使用tesseract(pytesseract 0.1.7)和opencv 3.3.0开发一个程序,用于在Id卡上自动提取文本。 我现在面临的问题是我的程序无法正常工作,OCR在我的MacBook上完全是假的,我不明白为什么。我想知道我应该怎样做才能让它在MacBook Pro上运行,就像在Ubuntu上运行一样

配置:

  • Ubuntu 16.04: tesseract是从源代码构建的

    $ tesseract --version
    tesseract cf0b378
    leptonica -1.74.1
      libjpeg 8d (libjpeg-turbo 1.4.2): libpng 1.2.54 : libtiff 4.0.6 : zlib 1.2.8
    
  • MacBook os X 10.12.6: 通过Homebrew安装tesseract

    $ tesseract --version:
    tesseract 3.05.01
    leptonica-1.74.4
      libjpeg 9b : libpng 1.6.32 : libtiff 4.0.8 : zlib 1.2.8
    

示例 如果我试试这个图像: image.jpg

运行此命令tesseract image.jpg stdout

tesseract cf0b378 我得到:Gabo / M

tesseract 3.05.01 我得到:GM"

1 个答案:

答案 0 :(得分:0)

我通过使用--HEAD选项构建tesseract来解决这个问题。

brew update
brew install tesseract --HEAD

现在我有了4.00.00alpha的tesseract,并且工作得非常好。

另外,我刚才在这里找到了这个答案:https://groups.google.com/forum/?utm_medium=email&utm_source=footer#!msg/tesseract-ocr/rdaG14IDVu8/RtihYxlOAQAJ