为什么OCR(MODI.MiLANGUAGES.miLANG_ENGLISH,true,true)导致OCR运行错误?

时间:2010-06-07 09:22:56

标签: c# ocr modi

我正在使用MODI读取tiff图像并执行我需要对文本执行的操作。一些图像工作正常,然后其他tiff图像总是导致该方法,

OCR(MODI.MiLANGUAGES.miLANG_ENGLISH,true,true)

失败。我研究过这个并尝试了不同的变体,例如参数列表中的'false','false'。我也尝试过SYSDEFAULT而不是英语,但我仍然得到错误。任何人都可以告诉我为什么它会在一些tiff图像上而不是在其他图像上失败?

我做了一些研究并找到了答案:

一个可能的原因是MODI尝试处理没有任何可识别文本的文件。空白文档或只有图纸/涂鸦并且实际上为空白的文档将导致此例外。

显然这还不够好,因为我无法让某个应用程序决定对某些图像进行OCR而不是其他图像。我处理异常,但OCR对象然后没有被初始化,所以我不能从那里做我需要做的事。

这是一场血腥的噩梦!为什么这个方法不能只是做血腥的工作,如果图像有一些不可读的页面,那么就忽略它们? 我正在使用Windows 7旗舰版和Office 2007旗舰版。

Visual Studio版本是2008 谢谢,

IW

1 个答案:

答案 0 :(得分:1)

OCR(MODI.MiLANGUAGES.miLANG_ENGLISH, true, true)

您可以使用

代替上述代码
OCR(MODI.MiLANGUAGES.miLANG_ENGLISH, false, false)

因为tiff图像可能是2400 * 2496。