在C#Project中使用Tesseract ocr

时间:2013-08-24 11:16:22

标签: c# visual-studio-2012 ocr tesseract

我已从Here下载了tesseract。当我试图将dll文件添加到visual studio 2012时,它显示错误,它不是有效的程序集。任何人都可以建议我dll的其他ocr文件和示例编码。我尝试了很多网站,但我找到了很好的网站。然后我找到了这个dll文件tessrect并使用了以下代码

string path = @"C:\pic\mytext.jpg";
Bitmap image = new Bitmap(path);
Tesseract ocr = new Tesseract();
ocr.SetVariable("tessedit_char_whitelist", "0123456789"); // If digit only
ocr.Init(@"C:\tessdata\", "eng", false); // To use correct tessdata
List<tessnet2.Word> result = ocr.DoOCR(image, Rectangle.Empty);
foreach (tessnet2.Word word in result)
Console.WriteLine("{0} : {1}", word.Confidence, word.Text);

但是视觉工作室抛出的错误是它无效的装配。任何人都可以帮助我...

编辑:仅限属性文件夹中的框架  谢谢你提前

2 个答案:

答案 0 :(得分:2)

我尝试使用Tesseract .NET wrapper。它有更令人愉快的语法:

using (var engine = new TesseractEngine(pathToLangFolder, "eng", EngineMode.Default))
{
    // have to load Pix via a bitmap since Pix doesn't support loading a stream.
    using (var image = new Bitmap(fileName))
    {
        using (var pix = PixConverter.ToPix(image))
        {
            using (var page = engine.Process(pix))
            {
                Console.WriteLine(page.GetMeanConfidence() + " : " + page.GetText());
            }
        }
    }
}

答案 1 :(得分:0)

为什么不试试 OCRSDK它是一项付费服务​​,也可以试用。从图像中提取文本时的准确率为85%