tesseract(.NET)+可搜索的PDF。如何申请?

时间:2013-11-29 13:15:19

标签: c# pdf-generation ocr tesseract tessnet2

我需要开发一个将图像转换为可搜索PDF的系统。 学校如何工作我需要一些开源的东西 经过大量研究后,我发现tessnet2(tesseract),我可以删除tiff格式的图像文本。 但是如何将这些信息转换为PDF? 注意:我需要保留文件结构。

我需要一个指导来继续我的研究。有人帮帮我。

谢谢

1 个答案:

答案 0 :(得分:2)

您可以在Tesseract 3rdParty页面查看几个.NET hOCR到PDF库。