wget命令行 - 定义格式和编码

时间:2014-05-25 01:30:12

标签: rest wget

尝试使用rest和wget(curl)从电子商务网站下载所有类别我无法制作可读文件。以下行是我执行的行:

...>wget https://api.mercadolibre.com/sites/MLB/categories/all --no-check-certificate 

我收到这样的信息 - >

½Û’Û8².ü*_[6q Hö]>t{\=¶ÇëðÇŽˆ¢ªè–ÄÜmïXûÖôeÇŽ¹˜˜»û®^ìHU €()‰dåŠ1]ì®,$&

我期待的是:

, {
    "id": "MLA1743",
    "name": "Autos, Motos y Otros"
}, {
    "id": "MLA1384",
    "name": "Bebés"
}, {
    "id": "MLA1039",
    "name": "Cámaras y Accesorios"
}, {
    "id": "MLA1051",
    "name": "Celulares y Teléfonos"
}, {
    "id": "MLA1798",
    "name": "Coleccionables y Hobbies"
}
抱歉,如果它是一个新手问题,但我找不到合适的教程。 brgds

1 个答案:

答案 0 :(得分:2)

内容是gzip编码的。您可以通过查看服务器随响应发送的Content-Encoding标头来解决这个问题。您可以访问以下数据:

wget -o- https://api.mercadolibre.com/sites/MLB/categories/all | zcat

或者首先将其保存到文件中:

wget -o all.gz https://api.mercadolibre.com/sites/MLB/categories/all
gunzip all.gz