是否可以合并ZipOutputStream和DigestOutputstream?

时间:2019-04-11 16:24:18

标签: java stream zip checksum

我需要先确定.zip文件的校验和,然后再将其上传到某处,以确保文件完整性。

目前,我有以下类似内容:

        for (File file : zipCandidates) {
            InputStream fileInputStream = new BufferedInputStream(new FileInputStream(file));
            ZipUtils.addDataToZip(zipStream, fileInputStream, file.getName());
            boolean deleted = file.delete();
            if (!deleted) {
                log.error("Failed to delete temporary file {} : {}", file.getName(), file.getAbsolutePath());
            }
        }
        zipStream.close();

        // checksum and filesize
        long fileSize = zipFile.length();
        InputStream fileInputStream = FileUtils.openInputStream(zipFile);
        BufferedInputStream bufferedFileInputStream = new BufferedInputStream(fileInputStream);
        String checksum = DigestUtils.md5Hex(bufferedFileInputStream);

        bufferedFileInputStream.close();


        // upload
        fileInputStream = FileUtils.openInputStream(zipFile);
        bufferedFileInputStream = new BufferedInputStream(fileInputStream);
        val writer = writerFactory.createWriter(blobName, fileSize, checksum);
        writer.write(bufferedFileInputStream);

        bufferedFileInputStream.close();

不用说,这是非常低效的,因为我必须读取每个.zip文件两次才能在上传之前识别其校验和。

是否可以通过某种方式将上面的ZipOutputStreamDigestOutputstream结合在一起,以便可以在编写zip文件时更新校验和?不幸的是,由于输出流必须是ZipOutputStream,所以我不能简单地修饰它(即new DigestOutputStream(zipStream, digest))。

2 个答案:

答案 0 :(得分:2)

  

不幸的是,由于输出流必须是ZipOutputStream,所以我不能简单地修饰它(即new DigestOutputStream(zipStream, digest))。

您还是不想,因为您想消化压缩操作的结果,因此需要用DigestOutputStream包装ZipOutputStream,即另一种方式:

try (ZipOutputStream zipStream = new ZipOutputStream(
                                   new DigestOutputStream(
                                     new FileOutputStream(zipFile),
                                     digest))) {
    // code adding zip entries here
}
String checksum = Hex.encodeHexString(digest.digest());

请注意使用try-with-resources确保您的ZipOutputStream始终正确关闭。

答案 1 :(得分:1)

您当然可以构造自己的输出流,该输出流包装两个输出流(在您的特定情况下,一个将是您的ZipOutputStream,另一个是您的DigestOutputStream)。您的新输出流实现会将接收到的每个字节写入两个包装的流中。

此用例非常普遍,您可能会找到满足您需求的开源版本(例如this one from apache commons)。