如何在Java中提取在线zip url

时间:2011-11-21 12:20:36

标签: java web-crawler

  

可能重复:
  How to extract .gz file Dynamically in Java?

我需要动态提取zip文件我不想在我的系统中存储zip文件。

示例:

http://www.newegg.com/Siteindex_USA.xml网站中有很多像

这样的zip文件网址

<loc> http://www.newegg.com//Sitemap/USA/newegg_sitemap_product01.xml.gz </loc>

我需要动态提取这个zip文件。解压缩此zip文件后,它将提取.xml文件,我需要读取所有链接的xml文件并存储在文件中。

请有人帮助我,我需要这部分代码来开发我的抓取工具。

1 个答案:

答案 0 :(得分:1)

使用ZipInputStream封送InputStream来自URLConnection.open()的内容。