我正在使用school example urllib2 POST请求,部分读取响应如下所示:
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
<table style="width: 100%; background-color: #FFFFFF;">
<tr>
<td style="width: 100%; border: 1px solid #d2d4f4; color: #002E2E; background-color: #ffffff; font: normal 12px Trebuchet MS; padding: 1px;"
align=left valign=top>&u0104;&u0021;&u0007;&u0031;&u0013;&u0001; &u0020;&u0021;&u0011; &u0002;&u0001;&u0021;&u0001;&u0018;&u0007;&u0023;&u0019;
&u0017;&u0001; &u0013;&u0019;&u0016;&u0020;&u0001;&u0017;&u0011;&u0012;&u0001;&u0023;&u0001;
<table
style="width: 100%; border-bottom: 1px solid #d2d4f4; background-color: #f6f6f4;">
<tr>
(我使用js beautifier,因为读数据比这更丑)
现在我不明白这个&u00xx
字符串是什么。它们代表单个字符,但它不能是我所知道的任何编码,因为我从未见过U+0001
例如(在这个例子中,FYI,&u0001
是字母a
)。
使用HTTPFox Firefox插件,我得到完全相同的POST数据,但结果在Firefox中呈现正常
如何使用Python将这些未知字符串转换为可读字符? 可以通过更改请求标题来纠正吗?
好的,我发现了问题。在Firefox中,POST请求数据使用ajax脚本进行后处理,该脚本将此实体转换为可读字符并在弹出窗口中显示。
请关闭此问题