Java - 读取BZ2文件并动态解压缩/解析

时间:2011-01-29 02:18:03

标签: java compression io

我有一个相当大的BZ2文件,里面有几个文本文件。我是否可以使用Java解压缩BZ2文件中的某些文件并动态解压缩/解析数据?假设一个300mb的BZ2文件包含1 GB的文本。理想情况下,我希望我的java程序能够读取1 MB的BZ2文件,动态解压缩,对其进行操作并继续读取BZ2文件以获取更多数据。这可能吗?

由于

2 个答案:

答案 0 :(得分:23)

来自apache的commons-compress库非常好。这是他们的样本页面: http://commons.apache.org/proper/commons-compress/examples.html

这是最新的maven片段:

<dependency>
    <groupId>org.apache.commons</groupId>
    <artifactId>commons-compress</artifactId>
    <version>1.10</version>
</dependency>

这是我的util方法:

public static BufferedReader getBufferedReaderForCompressedFile(String fileIn) throws FileNotFoundException, CompressorException {
    FileInputStream fin = new FileInputStream(fileIn);
    BufferedInputStream bis = new BufferedInputStream(fin);
    CompressorInputStream input = new CompressorStreamFactory().createCompressorInputStream(bis);
    BufferedReader br2 = new BufferedReader(new InputStreamReader(input));
    return br2;
}

答案 1 :(得分:2)

Ant项目包含一个bzip2库。其中有一个org.apache.tools.bzip2.CBZip2InputStream类。您可以使用此类动态解压缩bzip2文件 - 它只是扩展了标准的Java InputStream类。