IVI ocr Tesseract

时间:2013-02-21 08:09:29

标签: c# ocr tesseract

大家好我对c#(tessnet2)的ocr Tesseract有问题,它找到了caractèreIVI而不是“M”你可以帮帮我吗?

tessnet2.Tesseract ocr = new tessnet2.Tesseract();
         ocr.SetVariable("tessedit_char_whitelist", "ABCDEFGHIJKLMNOPQRSTUVWXYZ"); // If digit only
         ocr.Init(@"C:\tresnet", "fra", false); // To use correct tessdata
         List<tessnet2.Word> result = ocr.DoOCR(imgSortie, Rectangle.Empty);
         String ListeLettres= "";

         foreach (tessnet2.Word word in result)
           ListeLettres= ListeLettres + word.Text;

2 个答案:

答案 0 :(得分:0)

@ user2094482嗨,

我参与了Tesseract和c ++的字符识别。一旦我遇到同样的问题。我的系统识别了| v |而不是M甚至我的肉眼都清晰的图像。我尝试了几种图像预处理概念,如图像二值化,图像模糊等,以获得准确的结果。但这些方法都没有给我100%准确的结果。因此,我尝试了白名单,这是成功的。

text  = readLettersFromTesseractOCR(img_bw,&error,CharacterSequence);

CharacterSequence初始化如下。

 CharacterSequence = ABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789&lt

希望这也适用于您的系统。

答案 1 :(得分:0)

我只想对字符串使用替换函数并将“IVI”替换为“M”,因为实际上写入“IVI”的情况并不多。