我是OCR图书馆的新手,我使用此应用程序测试Google的Tesseract库:
https://play.google.com/store/apps/details?id=edu.sfsu.cs.orange.ocr&hl=en
结果非常糟糕。它很难识别出一个' r'并且大多数情况下将其混淆为' n'
我想问一下,不好的结果是因为Tesseract库不好还是结果还取决于应用程序的编写方式。
我在哪里可以学习使用Tesseract库并制作更好的应用程序?
Google Goggles使用哪个库?
答案 0 :(得分:2)
我认为tesseract可能是最好的开源OCR,可能比那里的一些商业更好。 Goolge An Overview of the Tesseract OCR Engine
在本文中寻找准确性测试即使这样,错误百分比也可能非常高。原因是tesseract在实际执行OCR之前会进行一些图像处理。现在,准确度取决于图像的质量和特定图像的处理方式。请参阅此链接Tesseract OCR Quality。您可以观察到在处理之后,一些要识别的字符不可用。此外,图像和字符的大小以及字体也很重要。
虽然tesseract不能直接实现所有识别作为通用引擎,但您可以随时训练(机器学习)tesseract来识别图片中的文本。您共享的应用程序可能会使用teserract。在为特定类型的识别开发应用程序时(例如:车牌,广告牌等),如果您可以训练tesseract并为其提供可以轻松识别的已处理图像,您将看到很多改进。