使用PDFBox从PDF页面裁剪区域

时间:2016-03-21 08:47:52

标签: pdf pdfbox

我正在尝试以编程方式从PDF页面中裁剪区域。具体来说,我的输入将是单页PDF和页面上的边界框。输出将是包含原始PDF中的字符,图形路径和图像的PDF,它应该看起来像原始PDF。换句话说,我想要一个类似于从图像中裁剪区域但使用PDF的功能。

三个问题:

  1. 是否可以做到?根据我对PDF的了解,似乎有可能。但我不是专家,所以我想首先知道是否有一些我在这里缺少的东西。

  2. 有没有这方面的开源软件?

  3. PDFBox目前可以这样做吗?我找不到这样的功能,但我可能错过了它。有人知道这样做的任何尝试吗?

1 个答案:

答案 0 :(得分:2)

1-是的,这称为crop box

2-是的,例如PDFBox的。

3-是的,只需打开PDF,设置裁剪框并保存:

PDDocument doc = PDDocument.load(new File(...));
PDPage page = doc.getPage(0);
page.setCropBox(new PDRectangle(20, 20, 200, 400));
doc.save(...);
doc.close();

PDRectangle中的数字为user space units。 1个单位= 1/72英寸。

请注意,裁剪框外的内容不会消失,只是隐藏了。