如何在python中解码网页响应

时间:2014-08-04 12:19:06

标签: python web encoding gzip

我解码了这样的gzip enecoding:

gzipper = gzip.GzipFile(fileobj=wepage_response)
decoded_str = str(gzipper)

现在decode_str看起来像这样:

<gzip 0\x82\x01\xcb\n\x01
\x00\xa0\x82\x01\xc40\x82\x01\xc0\x06\t+\x06\x01\x05\x05\x070\x01\x01\x04\x82\x0
1\xb10\x82\x01\xad0\x81\x96\xa2\x16\x04\x14J\xdd\x06\x16\x1b\xbc\xf6h\xb5v\xf5\x
81\xb6\xbbb\x1a\xbaZ\x81/\x18\x0f20140804010112Z0k0 ....>

我如何解释这个?

谢谢

1 个答案:

答案 0 :(得分:0)

您需要read()来自gzipper实例的内容:

import gzip
from cStringIO import StringIO

webpage_response = '\x1f\x8b\x08\x08\xe6|\xdfS\x00\x03test.txt\x00\xcb\xc8T(\xc9H-J\xe5\x02\x00\xb6\x0b\x88\x9b\t\x00\x00\x00'
gzipper = gzip.GzipFile(fileobj=StringIO(webpage_response))
decompressed_str = gzipper.read()

>>> decompressed_str
'hi there\n'