转换为UTF-8 Python时获得其他角色

时间:2016-07-05 17:50:52

标签: python utf-8

我正在尝试将html编码字符作为输入字符串的一部分转换为Python中的UTF8。我正在获得额外的角色Ã。如何在python中摆脱它。

实施例: 我应该得到“SlimRun®”的输出。 但是,我正在使用SlimRun®

我正在使用HTMLParser()

中的unescape methond

1 个答案:

答案 0 :(得分:0)

UTF8是一种多字节编码,因此您可以编码超过100万个字符。您必须解码utf8编码的字符串:

b'SlimRun\xc2\xae'.decode('utf8')