无法与PDFBox合并流

时间:2017-08-10 08:28:39

标签: pdf pdfbox

目前我可以在使用java.io.File时合并两个PDF文件,但在使用输入和输出流时无法合并它们。

代码下方工作并成功生成合并的PDF。

File mainDoc = new File(path...);
File additionalDoc = new File(path...);

PDFMergerUtility pdfMerger = new PDFMergerUtility();
pdfMerger.setDestinationFileName(path + "/merged.pdf");
pdfMerger.addSource(mainDoc);
pdfMerger.addSource(additionalDoc);
pdfMerger.mergeDocuments(null);

然后我尝试使用流来做同样的事情。

ByteArrayOutputStream out = new ByteArrayOutputStream();
InputStream mainDocStream = new FileInputStream(path...);
InputStream additionalDocSteam = new FileInputStream(path...);
PDFMergerUtility pdfMerger = new PDFMergerUtility();
pdfMerger.addSource(mainDocStream);
pdfMerger.addSource(additionalDocSteam);
pdfMerger.setDestinationStream(out);
pdfMerger.mergeDocuments(null);

上面的代码到达 pdfMerger.mergeDocuments(null); 时抛出以下异常:

  

java.io.IOException:错误:文件结束,预期行在   org.apache.pdfbox.pdfparser.BaseParser.readLine(BaseParser.java:1119)     在   org.apache.pdfbox.pdfparser.COSParser.parseHeader(COSParser.java:2005)     在   org.apache.pdfbox.pdfparser.COSParser.parsePDFHeader(COSParser.java:1988)     在org.apache.pdfbox.pdfparser.PDFParser.parse(PDFParser.java:269)     在org.apache.pdfbox.pdmodel.PDDocument.load(PDDocument.java:1143)     在org.apache.pdfbox.pdmodel.PDDocument.load(PDDocument.java:1059)     在   org.apache.pdfbox.multipdf.PDFMergerUtility.mergeDocuments(PDFMergerUtility.java:263)

最后我试着按照这个答案(Merge Pdf Files Using PDFBox)作为例子,但我生成的pdf似乎没有合并这两个pdf。 这是我试过的代码。

public InputStream createPDF() {
    try{
        // Note, i have also tried to use java.io.File instead of an 
        // InputStream but the result was the same
        // File mainDoc = new File(path...);
        // PDDocument document = PDDocument.load(mainDoc);
        InputStream pdfInputStream = null;
        InputStream mainDocStream = new FileInputStream(path...);
        PDDocument document = PDDocument.load(mainDocStream);
        InputStream additionalDocSteam = new FileInputStream(path...);
        PDDocument additionalDocument = PDDocument.load(additionalDocSteam);
        PDFMergerUtility pdfMerger = new PDFMergerUtility();

        pdfMerger.appendDocument(additionalDocument, document);
        document.save(out);
        document.close();
        PDDocument.load(out.toByteArray());

        pdfInputStream = new ByteArrayInputStream(out.toByteArray());

    }catch(...){
        ....
    }
    return pdfInputStream;
} 

上面的代码确实会生成PDF,但新创建的PDF只包含主文档的内容,而不包含第二个内容。所以它看起来我缺少一些东西,文件没有合并。

1 个答案:

答案 0 :(得分:1)

我能够找到解决方案,但我仍然无法理解使用流时出了什么问题。详细说明:

以下代码抛出异常( java.io.IOException:错误:文件结束,预期行)

ByteArrayOutputStream out = new ByteArrayOutputStream();
InputStream mainDocStream = new FileInputStream(path...);
InputStream additionalDocStream = new FileInputStream(path...);
PDFMergerUtility pdfMerger = new PDFMergerUtility();
pdfMerger.addSource(mainDocStream);
pdfMerger.addSource(additionalDocStream);
pdfMerger.setDestinationStream(out);
pdfMerger.mergeDocuments(null);

在addSource方法中使用File时,一切似乎都按要求工作。

public InputStream createPDF() {
    InputStream pdfInputStream = null;

    try{
        File mainDoc = new File(...);
        File additionalDoc = new File(path...);
        PDFMergerUtility pdfMerger = new PDFMergerUtility();
        pdfMerger.addSource(mainDoc);
        pdfMerger.addSource(additionalDoc);
        pdfMerger.setDestinationStream(out);
        pdfMerger.mergeDocuments(null);
        pdfInputStream = new ByteArrayInputStream(out.toByteArray());
    }catch(...){
        ...
    }
    return pdfInputStream;
}

现在,为什么使用流的第一种方法在直接使用文件时引发异常,这也是我想知道的。