如何从C#调用Acrobat功能OCR?

时间:2009-07-03 11:18:07

标签: c# api adobe ocr acrobat

我想编写一个可以在Adobe Acrobat中使用OCR功能的C#应用​​程序。我怎么称呼这个?是否有公共API?

2 个答案:

答案 0 :(得分:0)

我认为这是Adobe Reader软件的一部分,无法通过API访问。根据格式规范,有一个用于构建PDF文档的API和库,但是OCR是关注读者而不是格式的东西。我担心你要么必须使用另一个图书馆,要么自己实施。

答案 1 :(得分:0)

没有适用于.net的直接Adobe OCR API。对于你想要实现的目标,有一些替代方案。 GitHub上有一个开源的.Net包装器,用于Google的开源Tesseract OCR:https://github.com/charlesw/tesseract。这应该可以在C#中获得OCR功能。

来自文档:

  

快速入门

     
      
  1. 通过Package Manager Console运行Tesseract来添加Install-Package Tesseract NuGet包。
  2.   
  3. 确保您拥有Visual Studio 2012 x86&已安装x64运行时
  4.   
  5. tesseract-ocr下载tesseract 3.02的语言数据文件并将其添加到您的项目中,确保'复制到   输出目录'设置为始终。
  6.   
  7. 查看示例解决方案~/Samples/Tesseract.Samples.sln以获取工作示例
  8.