在CentOS 6上安装Tesseract-OCR

时间:2014-05-21 19:42:58

标签: centos install ocr tesseract

我试图在我的服务器上安装Tesseract-OCR然而当我安装所有我认为是正确的回购。当我尝试安装它时,找不到包

我尝试添加rpmforge但无济于事。来自之前已经完成或熟悉添加和搜索回购的人的任何想法?

6 个答案:

答案 0 :(得分:7)

我使用了这些在Centos中正常工作的说明

从Centos中的来源安装Tesseract OCR库

下载Leptonica和Teseract来源:

$ wget http://www.leptonica.org/source/leptonica-1.69.tar.gz
$ wget https://tesseract-ocr.googlecode.com/files/tesseract-ocr-3.02.02.tar.gz

配置,编译,安装libs:

 $ tar xzvf leptonica-1.69.tar.gz      
 $ cd leptonica-1.69      
 $ ./configure
 $ make
 $ sudo make install

 $ tar xzf tesseract-ocr-3.02.02.tar.gz
 $ cd tesseract-3.01
 $ ./autogen.sh
 $ ./configure
 $ make
 $ sudo make install
 $ sudo ldconfig

下载语言(英语)并复制到tessdata文件夹:

$ wget http://tesseract-ocr.googlecode.com/files/tesseract-ocr-3.02.eng.tar.gz       
$ tar xzf tesseract-ocr-3.02.eng.tar.gz       
$ sudo cp tesseract-ocr/tessdata/* /usr/local/share/tessdata

并享受它;)

答案 1 :(得分:5)

我建议尝试从rpm安装:http://pkgs.org/download/tesseract 还有几个依赖项:libpng-devel,libjpeg-devel,libtiff-devel,zlib和leptonica。 最后2也可以在RPM网站上找到

答案 2 :(得分:4)

这对我有用:

x == y

tesseract不在epel存储库中,但在epel-test repo中,默认情况下不会激活。

答案 3 :(得分:4)

我已经编写了一个bash脚本来在Centos 7上安装Tesseract 3.05。它可以获取并安装所有依赖项,还可以安装英语,印地语,孟加拉语和泰语的语言文件。

GitHub上的代码

https://github.com/EisenVault/install-tesseract-redhat-centos

希望这有帮助。

答案 4 :(得分:3)

从源代码安装Tesseract OCR库(于2018年7月14日更新)

下载Leptonica和Teseract来源:

$ wget http://www.leptonica.com/source/leptonica-1.76.0.tar.gz

$ wget https://sourceforge.net/projects/tesseract-ocr-alt/files/tesseract-ocr-3.02.02.tar.gz

配置,编译和安装Leptonica:

$ tar xzvf leptonica-1.76.0.tar.gz
$ cd leptonica-1.76.0
$ ./configure & make & sudo make install

配置,编译和安装Tesseract:

$ tar xzf tesseract-ocr-3.02.02.tar.gz
$ cd tesseract-ocr
$ ./autogen.sh & ./configure & make & sudo make install & sudo ldconfig

下载语言文件:

我在这里下载英语文件(eng.traineddata)。您可以在此处查看语言文件的完整列表,并根据需要下载。 https://github.com/tesseract-ocr/tesseract/wiki/Data-Files#data-files-for-version-302

下载语言(英语)并复制到tessdata文件夹:

$ wget https://sourceforge.net/projects/tesseract-ocr-alt/files/tesseract-ocr-3.02.eng.tar.gz
$ tar xzf tesseract-ocr-3.02.eng.tar.gz
$ sudo cp tesseract-ocr/tessdata/* /usr/local/share/tessdata

现在,您的Tesseract OCR已安装并可以使用! 示例:

$tesseract /path/to/input/test.jpg /path/to/output/abc.txt -l eng

享受!!!

答案 5 :(得分:0)

enter image description here

yum install --nogpgcheck tesseract

在安装后进行测试以输入以下命令: tesseract --version