我已从Here下载了tesseract
。当我试图将dll
文件添加到visual studio 2012时,它显示错误,它不是有效的程序集。任何人都可以建议我dll
的其他ocr
文件和示例编码。我尝试了很多网站,但我找到了很好的网站。然后我找到了这个dll
文件tessrect并使用了以下代码
string path = @"C:\pic\mytext.jpg";
Bitmap image = new Bitmap(path);
Tesseract ocr = new Tesseract();
ocr.SetVariable("tessedit_char_whitelist", "0123456789"); // If digit only
ocr.Init(@"C:\tessdata\", "eng", false); // To use correct tessdata
List<tessnet2.Word> result = ocr.DoOCR(image, Rectangle.Empty);
foreach (tessnet2.Word word in result)
Console.WriteLine("{0} : {1}", word.Confidence, word.Text);
但是视觉工作室抛出的错误是它无效的装配。任何人都可以帮助我...
编辑:仅限属性文件夹中的框架 谢谢你提前
答案 0 :(得分:2)
我尝试使用Tesseract .NET wrapper。它有更令人愉快的语法:
using (var engine = new TesseractEngine(pathToLangFolder, "eng", EngineMode.Default))
{
// have to load Pix via a bitmap since Pix doesn't support loading a stream.
using (var image = new Bitmap(fileName))
{
using (var pix = PixConverter.ToPix(image))
{
using (var page = engine.Process(pix))
{
Console.WriteLine(page.GetMeanConfidence() + " : " + page.GetText());
}
}
}
}
答案 1 :(得分:0)
为什么不试试 OCRSDK它是一项付费服务,也可以试用。从图像中提取文本时的准确率为85%