目前,我有一系列图像(PNG),并且每个图像都有一个未格式化的文本版本的内容。我想创建一个PDF,其中每个图像成为生成的PDF的完整页面,相应的文本也以某种方式附加到页面,以便搜索某些单词会将您带到包含该文本的页面,即使永远不会直接显示文字。
这是一次性工作,因此不必整洁或可扩展。我可以使用Linux系统上常用的任何语言,或常用的命令行工具。 (我也有一个可以使用Acrobat的Windows系统,虽然有近千个图像,所以手册不起作用。)
答案 0 :(得分:1)
尝试的一个选择是使用Java和Apache-Fop生成PDF,但这可能比您希望的更多。
你可以用iText做得更好; Example of adding PNG to iText to generate PDF
您需要确定如何生成用于放置可搜索文本的Layer
;我无法告诉你如何做这一步。
Here是如何判断PDF是否包含文本,这可能有助于您构建文本。