我正在尝试解码和ascii,它与字符串
结合使用例如
glbosworth
但我没有得到确切的输出
'glbosworth'.decode("ascii")
输出
u'glbosworth'
如果你删除这个字符&#并只尝试整数我得到这个
>>> chr(108)
'l'
>>> chr(115)
's'
>>> chr(111)
'o'
>>> chr(114)
'r'
>>> chr(104)
'h'
预期产出
glbosworth
我如何解码这个" g&#108bo&#115w&#111&#114t&#104"预期产出
答案 0 :(得分:0)
您正在尝试解码html escaped string。您可以使用html.unescape(s)
函数执行此操作(在python3上):
import html
print(html.unescape('glbosworth'))
输出:
'glbosworth'
看一下this所以回答更多信息
答案 1 :(得分:0)
,您可以使用html.unescape:
import html
print(html.unescape('glbosworth'))
你可以使用HTMLParser:
from HTMLParser import HTMLParser
h = HTMLParser()
print(h.unescape('glbosworth'))