如何在不将整个字节数组分配到内存的情况下编写文件?

时间:2010-08-12 22:04:13

标签: java performance file memory

这是一个新手问题,我知道。你们能帮忙吗?

我说的是大文件,当然,超过100MB。我想象某种循环,但我不知道该用什么。分块流?

有一种情况是肯定的:我不想要这样的东西(伪代码):

File file = new File(existing_file_path);
byte[] theWholeFile = new byte[file.length()]; //this allocates the whole thing into memory

File out = new File(new_file_path);
out.write(theWholeFile);

更具体地说,我必须重新编写一个下载base64编码文件并将其解码为“普通”文件的applet。因为它是由字节数组构成的,所以它在内存中保存两倍的文件大小:一个base64编码,另一个解码。我的问题不是关于base64。这是为了节省记忆。

你能指出我正确的方向吗? 谢谢!

5 个答案:

答案 0 :(得分:4)

从问题来看,您似乎正在将文件的base64编码内容读入数组,在最终保存之前将其解码为另一个数组。

考虑内存时,这是一个开销。特别是考虑到Base64编码正在使用的事实。它可以通过以下方式提高效率:

完成读写操作的缓冲以防止频繁的IO访问。您可以使用适合您的应用程序负载的缓冲区大小;通常,缓冲区大小选择为some power of two, because such a number does not have an "impedance mismatch" with the physical disk buffer

答案 1 :(得分:2)

文件上可能是FileInputStream,读取固定长度的块,进行转换并将其写入FileOutputStream

答案 2 :(得分:0)

答案 3 :(得分:0)

使用this base64 encoder/decoder,它将包装文件输入流并动态处理解码:

InputStream input = new Base64.InputStream(new FileInputStream("in.txt"));
OutputStream output = new FileOutputStream("out.txt");

try {
    byte[] buffer = new byte[1024];
    int readOffset = 0;
    while(input.available() > 0) {
        int bytesRead = input.read(buffer, readOffset, buffer.length);
        readOffset += bytesRead;
        output.write(buffer, 0, bytesRead);
    }
} finally {
    input.close();
    output.close();
}

答案 4 :(得分:0)

您可以使用org.apache.commons.io.FileUtils。除了您要查找的内容之外,此util类还提供其他选项。例如:

  • FileUtils.copyFile(final File srcFile, final File destFile)
  • FileUtils.copyFile(final File input, final OutputStream output)
  • FileUtils.copyFileToDirectory(final File srcFile, final File destDir)

等等..您也可以关注this tut.