使用pdfbox将pdf转换为byte [],反之亦然

时间:2013-07-17 19:07:04

标签: java pdf pdf-generation pdfbox

我已经阅读了文档和示例,但我很难将它们放在一起。我只是试图获取一个测试pdf文件,然后将其转换为字节数组,然后获取字节数组并将其转换回pdf文件,然后将pdf文件创建到磁盘上。

它可能没什么用,但这是我到目前为止所做的:

package javaapplication1;

import java.io.ByteArrayOutputStream;
import java.io.IOException;
import org.apache.pdfbox.cos.COSStream;
import org.apache.pdfbox.exceptions.COSVisitorException;
import org.apache.pdfbox.pdmodel.PDDocument;

public class JavaApplication1 {

    private COSStream stream;

    public static void main(String[] args) {
        try {
            PDDocument in = PDDocument.load("C:\\Users\\Me\\Desktop\\JavaApplication1\\in\\Test.pdf");
            byte[] pdfbytes = toByteArray(in);
            PDDocument out;
        } catch (Exception e) {
            System.out.println(e);
        }
    }

    private static byte[] toByteArray(PDDocument pdDoc) throws IOException, COSVisitorException {
        ByteArrayOutputStream out = new ByteArrayOutputStream();
        try {
            pdDoc.save(out);
            pdDoc.close();
        } catch (Exception ex) {
            System.out.println(ex);
        }
        return out.toByteArray();
    }

    public void PDStream(PDDocument document) {
        stream = new COSStream(document.getDocument().getScratchFile());
    }
}

1 个答案:

答案 0 :(得分:8)

您可以使用Apache commons,这在任何java项目IMO中都是必不可少的。

然后,您可以使用FileUtilsreadFileToByteArray(File file)writeByteArrayToFile(File file, byte[] data)

(这里是commons-io,这是FileUtils所在的地方:http://commons.apache.org/proper/commons-io/download_io.cgi

例如,我在这里试过这个并且效果很好。

try {
    File file = new File("/example/path/contract.pdf");
    byte[] array = FileUtils.readFileToByteArray(file);
    FileUtils.writeByteArrayToFile(new File("/example/path/contract2.pdf"), array);

} catch (IOException e) {
    e.printStackTrace();
}