使用IText解析PDF文件以在现有文本中添加超链接

时间:2014-07-21 06:51:00

标签: java itext pdfbox pdf-parsing

我知道PDF不是用于编辑的,但我有一个要求,我需要解析PDF并修改它以将所有文本元素转换为超链接。 有没有办法实现这个目标?

非常感谢,

1 个答案:

答案 0 :(得分:1)

将文本元素转换为超链接涉及多个操作:

  1. 您必须应用文本提取,同时提取文本位置,而不仅仅是纯文本。

  2. 在带有位置的提取文本中,您必须找到要制作超链接的所有文本部分。

  3. 找到它们后,取出它们的位置并添加适当的注释以使它们超链接。

  4. 使用位置提取文本可以在iText中实现LocationTextExtractionStrategy的变体(参见this answer;即使它是为iTextSharp编写的,同样的原则适用)和PDFBox覆盖{ {1}}。