标签: c# pdf-generation ocr tesseract tessnet2
我需要开发一个将图像转换为可搜索PDF的系统。 学校如何工作我需要一些开源的东西 经过大量研究后,我发现tessnet2(tesseract),我可以删除tiff格式的图像文本。 但是如何将这些信息转换为PDF? 注意:我需要保留文件结构。
我需要一个指导来继续我的研究。有人帮帮我。
谢谢
答案 0 :(得分:2)
您可以在Tesseract 3rdParty页面查看几个.NET hOCR到PDF库。