我想使用Hadoop mapreduce处理受密码保护的压缩文件。我能够使用ZipFileInputformat处理未受保护的zip文件。但它不支持密码保护的拉链。 是否有任何Java库提供对受密码保护的zip文件的流访问或提取zip文件,如果我可以使其字节内容可用?在此先感谢。
答案 0 :(得分:0)
假设您可以找到一个可以读取受密码保护的zip文件的java库(例如see this blog文章),您应该能够修改当前的ZipFileInputFormat以使用此库,然后您只需要通过配置选项配置每个zip文件的密码(希望您没有太多文件,或者使用相同的密码保护所有文件)。
应该很容易。尝试一下,如果遇到问题,请发布另一个问题 - 或者询问输入格式的作者(https://github.com/cotdp/com-cotdp-hadoop是通过谷歌找到的ZipFileInputFormat的一种可能实现),以确定他是否可以为您滚动更新< / p>