应用错误收集

为什么Tesseract无法识别我的形象？

时间：2013-06-17 12:16:22

标签： ocr

请参阅图片：http://s18.postimg.org/wvwj4yt4l/ashx.jpg

我认为我的图像非常简单但是tesseract-ocr无法识别它:(它显示“AÂ§§§SX”，而不是A9FCCC

请告诉我原因？ tesseract如何认识它？

由于

1 个答案:

答案 0 :(得分：0)

基本的Tesseract Engine 不适用于CPATCHA破解。即使文本/字母角度不是完全水平的，打印介质的扫描页面也会很好。失真和像素化 - 在一定程度上 - 也不会有太大问题。

但带的字母（大幅）格式错误的形状就像您关联的那样，将无法识别。 OCR，特别是CAPTCHA破解比下载Tesseract二进制文件要复杂得多。如果这很容易，那么所有付费服务都将在夜间停业。 OCR主题非常复杂，我个人不敢触摸它。