目前我正在研究Puma.NET并将扫描的多页tif转换为可搜索的pdf文件。但是,是否有任何开源库提供通过此文本pdf生成图像的功能?这样原始的tif文件以pdf格式保存,ocr文本被隐藏但可供选择或搜索。
感谢Andrew的快速回复。如果我现有的库无法实现结果,我一定会给QuickPDF一个镜头。 : - )
不过,我刚才有了一个更好的主意。我想我可以使用iTextSharp来做到这一点。但是,我有两个问题,因为我是iTextSharp的新手。1)如何在pdf中添加不同大小的页面? 2)如何使用SetAbsolutePosition或任何其他函数在特定页面上添加图像层?
如果有人能为我提供上述问题的iTextSharp代码,那就太棒了!
答案 0 :(得分:1)
您可以使用Quick PDF Library LITE,它应具有足够的功能来满足您的需求。它不是开源的,但可以免费使用。
http://www.quickpdflibrary.com/free/lite.php
您需要使用以下功能
QP.SetPageSize(); QP.SetOrigin(); QP.AddImageFromFile(); QP.SetTextSize(); QP.DrawTextBox(); QP.SetTextColor(); QP.NewPage();
在添加图像之前,您需要添加白色文本对象。
安德鲁。
免责声明:我为此产品做了一些咨询工作。