为什么Tesseract无法识别我的形象?

时间:2013-06-17 12:16:22

标签: ocr

请参阅图片:http://s18.postimg.org/wvwj4yt4l/ashx.jpg

我认为我的图像非常简单但是tesseract-ocr无法识别它:(它显示“A§§§SX”,而不是A9FCCC

请告诉我原因? tesseract如何认识它?

由于

1 个答案:

答案 0 :(得分:0)

基本的Tesseract Engine 不适用于CPATCHA破解。即使文本/字母角度不是完全水平的,打印介质的扫描页面也会很好。 失真和像素化 - 在一定程度上 - 也不会有太大问题。

的字母(大幅)格式错误的形状就像您关联的那样,将无法识别。 OCR,特别是CAPTCHA破解比下载Tesseract二进制文件要复杂得多。如果这很容易,那么所有付费服务都将在夜间停业。 OCR主题非常复杂,我个人不敢触摸它。