如何在PDF中添加隐藏的ocr文本

时间:2011-11-11 04:21:35

标签: pdf ocr tiff

目前我正在研究Puma.NET并将扫描的多页tif转换为可搜索的pdf文件。但是,是否有任何开源库提供通过此文本pdf生成图像的功能?这样原始的tif文件以pdf格式保存,ocr文本被隐藏但可供选择或搜索。


感谢Andrew的快速回复。如果我现有的库无法实现结果,我一定会给QuickPDF一个镜头。 : - )

不过,我刚才有了一个更好的主意。我想我可以使用iTextSharp来做到这一点。但是,我有两个问题,因为我是iTextSharp的新手。

1)如何在pdf中添加不同大小的页面? 2)如何使用SetAbsolutePosition或任何其他函数在特定页面上添加图像层?

如果有人能为我提供上述问题的iTextSharp代码,那就太棒了!

1 个答案:

答案 0 :(得分:1)

您可以使用Quick PDF Library LITE,它应具有足够的功能来满足您的需求。它不是开源的,但可以免费使用。

http://www.quickpdflibrary.com/free/lite.php

您需要使用以下功能

QP.SetPageSize();   QP.SetOrigin();   QP.AddImageFromFile();   QP.SetTextSize();   QP.DrawTextBox();   QP.SetTextColor();   QP.NewPage();

在添加图像之前,您需要添加白色文本对象。

安德鲁。

免责声明:我为此产品做了一些咨询工作。