我需要OCR扫描文档的特定区域,我正在使用MODI(Microsoft的Document Imaging COM对象)。
我的代码目前OCR是整个页面(非常准确!),但我想定位页面的特定区域,其中文本始终是静态的(订单号)。我怎么能这样做?
以下是我的页面代码:
MODI.Document md = new MODI.Document();
md.Create("c:\\temp\\mpk.tiff");
md.OCR(MODI.MiLANGUAGES.miLANG_ENGLISH, true, true);
MODI.Image image = (MODI.Image)md.Images[0];
FileStream createFile = new FileStream("c:\\temp\\mpk.txt", FileMode.CreateNew);
StreamWriter writeFile = new StreamWriter(createFile);
writeFile.Write(image.Layout.Text);
writeFile.Close();
md.Close();
我可以以某种方式指定图像的区域吗?
非常感谢任何帮助!
答案 0 :(得分:2)
无法裁剪我在MODI对象模型中看到的图像。另一种方法是为其提供一个只包含您要转换的订单号的图像。您可以使用System.Drawing命名空间中的类从原始类创建它。检查this MSDN page以获取示例代码。