在PDF文件中查找字符串的位置,然后对其进行操作

时间:2011-03-08 15:15:37

标签: java pdf itext

我需要编写一个小实用程序,在PDF文件中搜索字符串,然后在字符串上放置图像。

我刚刚意识到iText无法实现搜索PDF文档中字符串的位置X,y的任务,因为它不是渲染器。 (我错了,请告诉我!! :))

所以我正在努力寻找解决方案。

现在我正在用JAVA编程,所以最好有一个库或JAVA的其他东西,但无论如何请告诉我你是否知道解决方案或提示.. :)

谢谢!

4 个答案:

答案 0 :(得分:2)

PDFBox和JPedal都允许您搜索PDF。

答案 1 :(得分:1)

检查我之前问PDF library for Java

的问题

答案 2 :(得分:1)

iText可以在PDF中找到文本的位置,它不会将该信息转换为像素。

RenderListener将获得在给定页面上呈现的所有文本的大部分图形状态。从中你可以提取坐标,方向,大小,字体等。

这里有几个浮动SO的例子。 iText in Action 2nd edition 触及PdfContentParser及其在第15章末尾的关联类。这意味着有code samples online

答案 3 :(得分:1)

我和你有完全相同的要求(找到一个字符串并用图像替换它),并使用PDFBox

重写org.apache.pdfbox.util.PDFTextStripper类,并存储您要查找的字符串的TextPosition。您可以将图像添加到TextPosition给出的X,Y位置的PDF中。