我有一个相当大的BZ2文件,里面有几个文本文件。我是否可以使用Java解压缩BZ2文件中的某些文件并动态解压缩/解析数据?假设一个300mb的BZ2文件包含1 GB的文本。理想情况下,我希望我的java程序能够读取1 MB的BZ2文件,动态解压缩,对其进行操作并继续读取BZ2文件以获取更多数据。这可能吗?
由于
答案 0 :(得分:23)
来自apache的commons-compress库非常好。这是他们的样本页面: http://commons.apache.org/proper/commons-compress/examples.html
这是最新的maven片段:
<dependency>
<groupId>org.apache.commons</groupId>
<artifactId>commons-compress</artifactId>
<version>1.10</version>
</dependency>
这是我的util方法:
public static BufferedReader getBufferedReaderForCompressedFile(String fileIn) throws FileNotFoundException, CompressorException {
FileInputStream fin = new FileInputStream(fileIn);
BufferedInputStream bis = new BufferedInputStream(fin);
CompressorInputStream input = new CompressorStreamFactory().createCompressorInputStream(bis);
BufferedReader br2 = new BufferedReader(new InputStreamReader(input));
return br2;
}
答案 1 :(得分:2)
Ant项目包含一个bzip2库。其中有一个org.apache.tools.bzip2.CBZip2InputStream
类。您可以使用此类动态解压缩bzip2文件 - 它只是扩展了标准的Java InputStream
类。