如何将基于图像的PDF转换为基于文本的PDF。有很多工具可供使用。但我正在寻找一个C#代码来制作一个应用程序。我听说过Tessara,但我没有得到C#的代码。它仅适用于c / c ++。
我使用MODI dll将Image转换为Text。该过程是将每页PDF转换为图像(使用Acrobat dll)并使用该输出Image(bmp / tif)我们可以使用MODI来获取文本。有没有可能将MODI对象更改为PDF?
MODI.Document doc = new MODI.Document();
doc.Create(ImagePath);
doc.OCR(MODI.MiLANGUAGES.miLANG_ENGLISH, false, false);
doc.SaveAs("c://.../test.pdf", MODI.MiFILE_FORMAT.miFILE_FORMAT_DEFAULTVALUE, MODI.MiCOMP_LEVEL.miCOMP_LEVEL_HIGH);
//But this line creating PDF but the PDF is not opened. Due to error.
如果你有任何其他方法可以这样做,请告诉我。
此致 R.Balajiprasad