xml.gz中的亚马逊站点地图数据表单不可压缩

时间:2016-05-24 12:44:03

标签: amazon sitemap gz

这可能是一个非常愚蠢的问题,但是......我正在尝试获取亚马逊网站地图,我查看了amazon.com/robots.txt。他们为我们下载的站点地图提供了几个.xml.gz文件。我遇到的问题是我无法解压缩它们。我觉得我错过了很明显的东西。

例如,一个站点地图是:http://www.amazon.com/sitemaps.f3053414d236e84.SitemapIndex_0.xml.gz

谢谢!

2 个答案:

答案 0 :(得分:1)

这种情况正在发生,因为Content-Type在响应中设置为binary/octet-stream。如果您将Content-Type响应标头覆盖为text/xml, 浏览器会自动解压缩文件。

答案 1 :(得分:0)

我刚刚将* .xml.gz重命名为* .xml并在文本编辑器中打开它,然后才开始工作。

我不知道浏览器是否有问题或文件是否已损坏。