我无法使用.NET中的tesseract-ocr-setup-3.02.02.exe从图像中提取文本 我使用了here
中的简单yatt类(yatt / tesseract-ocr-class.cs)我已经从here下载并安装了esseract-ocr-setup-3.02.02.exe 然后像这样使用C#中的yatt类
TesseractOCR ocr = new TesseractOCR(@"C:\Program Files (x86)\Tesseract-OCR\tesseract.exe");
using (Bitmap bmp = new Bitmap(@"C:\ocr\cap.jpg"))
divOCRText.InnerHtml = ocr.OCRFromBitmap(bmp);
从图像中提取文本但有很多问题。提取的文本有很多拼写错误。有人可以指导我做错了吗?
以下是OCR图片
提取的文字(屏幕截图)
以下是我个人电脑中的testdata安装