我正在尝试以编程方式从PDF页面中裁剪区域。具体来说,我的输入将是单页PDF和页面上的边界框。输出将是包含原始PDF中的字符,图形路径和图像的PDF,它应该看起来像原始PDF。换句话说,我想要一个类似于从图像中裁剪区域但使用PDF的功能。
三个问题:
是否可以做到?根据我对PDF的了解,似乎有可能。但我不是专家,所以我想首先知道是否有一些我在这里缺少的东西。
有没有这方面的开源软件?
PDFBox目前可以这样做吗?我找不到这样的功能,但我可能错过了它。有人知道这样做的任何尝试吗?
答案 0 :(得分:2)
1-是的,这称为crop box。
2-是的,例如PDFBox的。
3-是的,只需打开PDF,设置裁剪框并保存:
PDDocument doc = PDDocument.load(new File(...));
PDPage page = doc.getPage(0);
page.setCropBox(new PDRectangle(20, 20, 200, 400));
doc.save(...);
doc.close();
PDRectangle中的数字为user space units。 1个单位= 1/72英寸。
请注意,裁剪框外的内容不会消失,只是隐藏了。