以编程方式查找和替换pdf中的文本

时间:2010-06-24 02:02:37

标签: c# php pdf replace

我正在尝试创建一个Web脚本,允许我更改已上传的PDF模板并重新输出它们。我已经尝试过Zend,它允许我写一个PDF,但这意味着将PDF留在某个空间,这对于我需要的原始空间来说。 PDFFlip没有任何改善。

我们需要实现功能,以便我们可以从PDF中删除内容以及删除和替换。我看过CAM :: PDF和changepagestring.pl,但我不确定是否可以胜任这项工作。我很难找到任何真实的用法示例,Perl不是我以前用过的语言。

这是一个Web项目,但我对我们使用的语言很灵活,理想情况下PHP或ASP.NET C#会很棒。除非没有其他办法,否则最好不要使用Java。

我还应该指出,我没有运气就浏览了FoxitReader SDK。我从未试图实现它,但我没有发现找到和替换功能。

2 个答案:

答案 0 :(得分:2)

您可以修改PDF文本,但只是搜索和替换它并不简单。文本被设计为结束文件格式,不便于编辑。我写了一篇博文,解释了http://pdf.jpedal.org/java-pdf-blog/bid/12670/PDF-text

中的一些问题

答案 1 :(得分:2)

可能是解决方法,最好是以更舒适的编辑格式保存和填写模板?例如。您可以将模板保留为Microsoft Word模板,然后在填充后将其导出为PDF。这个thread可能会有用。

PDF文件格式不适合编辑。

另一种方法是,您可以将模板准备为包含表单字段的PDF。在这种情况下,填写表单字段是常见且众所周知的任务,并且有很多pdf组件。