Question

我正在尝试解码以下列方式编码的聊天节目：
＆安培; #NUMBER;
我试过了：

 s.decode("utf8")

和

 s.decode("unicode-escape")

但两者似乎都不起作用。

我应该用什么编码来解码这种？

一般情况下 - 我在哪里可以找到所有有效编码的列表？

Answer 1

Python 2 ：

import HTMLParser
h = HTMLParser.HTMLParser()
print h.unescape('&pound;682m')
£682m

Python 3 ：

import html.parser
h = html.parser.HTMLParser()
print(h.unescape('&pound;682m'))
£682m

.encode和.decode以一种不同的方式工作，然后你会发现我害怕。请参阅以下内容：

print 'å'.decode('iso-8859-1')
u'\x86'

当我将它输入控制台（å）时，字符串在latin-1中编码，但我的终点使用iso-8859-1，所以我可以重新编码它以适合我的端点的字符编码。