我喜欢使用PDFBox从大PDF中提取单个页面。我所有的“真实”PDF文件都位于一个目录中。因此,如果我提取一个页面,我想将此页面保存到单个页面的不同目录中)。 (或将其管道标准化)
问题:有没有办法定义输出目录或输出前缀,如-prefix=/tmp/pdf-snipped-
带有PDFSplit选项的PDFBox将分割的页面存储在与源pdf相同的目录中。但这不太好。
顺便说一句:在拆分之前复制源pdf不是一个选项,因为它有很大的(超过1 GB)
答案 0 :(得分:1)
回答我自己的问题:
看起来,没有选项(也没有隐藏)来定义输出前缀或输出文件名。
所以我决定下载并更改PDFbox源代码并添加一个新选项(“prefix”)来定义存储剪裁的PDF的路径或定义输出名称。
如果你有同等的问题,那么这就是我的方式:
1.来自svn:http://pdfbox.apache.org/downloads.html#scm的下载源 并在此文件中更改代码:
{PDFBOX-source-root}/pdfbox/src/main/java/org/apache/pdfbox/PDFSplit.java
2.使用maven构建自己的PDFBox版本: http://pdfbox.apache.org/building.html
答案 1 :(得分:1)
outputPrefix
工作正常。本示例将页面写入c:\
并将其命名为docname-1.pdf
,docname-2.pdf
,...
java -jar pdfbox-app-2.0.20.jar PDFSplit -split 1 -outputPrefix C:\docname original.pdf
答案 2 :(得分:0)
-outputPrefix选项可用于定义输出保存位置。