Tesseract 3和Tesseract 4之间的区别?

时间:2018-01-29 09:55:01

标签: ocr tesseract

Tesseract 3和Tesseract 4有哪些主要区别?为什么我要选择一个而不是另一个?

2 个答案:

答案 0 :(得分:4)

Tesseract 4增加了一个基于LSTM神经网络的新型OCR引擎。新版本的版本是faster and more accurate而不是版本3.缺点是它仍然是alpha级别的软件。

这些幻灯片更详细地解释了这些变化:https://github.com/tesseract-ocr/docs/blob/master/das_tutorial2016/6ModernizationEfforts.pdf

答案 1 :(得分:0)

Tesseract 4.0的准确性优于tesseract3。Tesseract 4使用深度学习模型:长短期记忆(LSTM)神经网络,它是一种递归神经网络(RNN)。

但是请检查系统要求,例如如果您使用的是Ubuntu 16.04 LTS,则Tesseract将安装版本3,而不是版本4。如果您使用的是Ubuntu 18.04,则可以安装最新的Tesseract版本4。

有关更多详细信息,请参阅以下文章:

  1. 此处给出了tesseract的简短理论: https://limitlessdatascience.wordpress.com/2019/07/01/tesseract-4-0-intro-installation/

  2. Tesseract 3 Vs 4输出比较:https://limitlessdatascience.wordpress.com/2019/07/31/tesseract-3-0-and-4-0-implementation-and-output-comparison/