我计划在我的项目中使用OCR并搜索更多的OCR方法,但我没有找到任何正确的方法。最后我听说MODI
,我试过了。但它抛出以下错误:
检索具有CLSID {40942A6C-1520-4132-BDF8-BDC1F71F547B}的组件的COM类工厂因以下错误而失败:80040154
我正在使用Microsoft Office 2013
和visual studio 2012
。
我使用的代码如下:
private void button1_Click(object sender, EventArgs e)
{
CheckFileType(@"E:\\");
}
public void CheckFileType(string directoryPath)
{
IEnumerator files = Directory.GetFiles(directoryPath).GetEnumerator();
while (files.MoveNext())
{
//get file extension
string fileExtension = Path.GetExtension(Convert.ToString(files.Current));
//get file name without extenstion
string fileName=Convert.ToString(files.Current).Replace(fileExtension,string.Empty);
//Check for JPG File Format
if (fileExtension == ".jpg" || fileExtension == ".JPG") // or // ImageFormat.Jpeg.ToString()
{
try
{
//OCR Operations ...
MODI.Document md = new MODI.Document();
md.Create(Convert.ToString(files.Current));
md.OCR(MODI.MiLANGUAGES.miLANG_ENGLISH, true, true);
MODI.Image image = (MODI.Image)md.Images[0];
//create text file with the same Image file name
FileStream createFile = new FileStream(fileName + ".txt",FileMode.CreateNew);
//save the image text in the text file
StreamWriter writeFile = new StreamWriter(createFile);
writeFile.Write(image.Layout.Text);
writeFile.Close();
}
catch (Exception)
{
MessageBox.Show("This Image hasn't a text or has a problem",
"OCR Notifications",
MessageBoxButtons.OK, MessageBoxIcon.Information);
}
}
}
}
任何人都可以帮助我吗?这个问题是基于Microsoft Office版本还是我需要进行任何更改?那是更好的OCR
dll
吗?谢谢..
答案 0 :(得分:1)
出现错误的原因是Microsoft Office Document Imaging(MODI)已停止使用MS Office 2010.这与Office 2013中的OneNote合作。
即使我仍在搜索解决方案,或者是否有任何其他工具可以从图像中提取文本。如果您知道任何或有解决方案,请分享。