来自请求的奇怪字符

时间:2012-05-28 21:27:18

标签: python http

我正在使用school example urllib2 POST请求,部分读取响应如下所示:

<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
<table style="width: 100%; background-color: #FFFFFF;">
    <tr>
        <td style="width: 100%; border: 1px solid #d2d4f4; color: #002E2E; background-color: #ffffff; font: normal 12px Trebuchet MS; padding: 1px;"
        align=left valign=top>&u0104;&u0021;&u0007;&u0031;&u0013;&u0001; &u0020;&u0021;&u0011; &u0002;&u0001;&u0021;&u0001;&u0018;&u0007;&u0023;&u0019;
            &u0017;&u0001; &u0013;&u0019;&u0016;&u0020;&u0001;&u0017;&u0011;&u0012;&u0001;&u0023;&u0001;
            <table
            style="width: 100%; border-bottom: 1px solid #d2d4f4; background-color: #f6f6f4;">
                <tr>

(我使用js beautifier,因为读数据比这更丑)

现在我不明白这个&u00xx字符串是什么。它们代表单个字符,但它不能是我所知道的任何编码,因为我从未见过U+0001例如(在这个例子中,FYI,&u0001是字母a)。

使用HTTPFox Firefox插件,我得到完全相同的POST数据,但结果在Firefox中呈现正常

如何使用Python将这些未知字符串转换为可读字符? 可以通过更改请求标题来纠正吗?


好的,我发现了问题。在Firefox中,POST请求数据使用ajax脚本进行后处理,该脚本将此实体转换为可读字符并在弹出窗口中显示。

请关闭此问题

0 个答案:

没有答案