合并PDF与Apache PDFBox&在节后插入

时间:2016-05-23 19:56:52

标签: apache latex pdf-generation server-side pdfbox

我需要将多个文件合并在一起以某种方式创建单个PDF。理想情况下,我可以将PDF作为输入,然后将它们混合在一起,而不必担心格式化,所以我想暂时这样做。最后,如果我可以浏览PDF以获取有关PDF中某个部分的特定元数据,并在该部分之后插入内容,那将是很好的。

基本上,类似于html for PDFs中的id属性就是我所需要的(没有扫描PDF文本,因为这可能会改变)。最糟糕的情况是,我可以使用JSON作为临时格式并使用JSON创建PDF,但如果我不必,我不想动态格式化PDF。 JSON-> LaTeX-> PDF(或者可能只是LaTeX-> PDF)看起来就像我在那里看到的那样,这看起来像是严格需要的预处理。

基本上,有没有办法通过一些隐藏的PDF元数据来做到这一点,还是我正在考虑扫描文档文本中的关键字?

脚注: 我假设我将获得一个文本文件(转换为JSON)或一个PDF作为初始输入,但我确实想要PDF输出。基本上,只需创建一个PDF就比要求用JSON编写简单。

0 个答案:

没有答案