从图像中提取的文本不正确以及如何为C#改进tesseract-ocr 3.0?

时间:2013-12-06 12:39:41

标签: c# ocr tesseract tessnet2

我无法使用.NET中的tesseract-ocr-setup-3.02.02.exe从图像中提取文本      我使用了here

中的简单yatt类(yatt / tesseract-ocr-class.cs)

我已经从here下载并安装了esseract-ocr-setup-3.02.02.exe 然后像这样使用C#中的yatt类

        TesseractOCR ocr = new TesseractOCR(@"C:\Program Files (x86)\Tesseract-OCR\tesseract.exe");          
        using (Bitmap bmp = new Bitmap(@"C:\ocr\cap.jpg"))
        divOCRText.InnerHtml = ocr.OCRFromBitmap(bmp);

从图像中提取文本但有很多问题。提取的文本有很多拼写错误。有人可以指导我做错了吗?

以下是OCR图片

enter image description here

提取的文字(屏幕截图)

enter image description here

以下是我个人电脑中的testdata安装

enter image description here

0 个答案:

没有答案