我是一个新鲜的蟒蛇,谢谢你的帮助。
我只想将Escape Sequence转换为Character Entities,比如<
更改为<
,但是一个HTML页面有许多不同的转义序列,我不能写很多替换语句,如:
str = str.replace(' ', ' ')
...............many code.........
str = str.replace('<', '<')
str = str.replace('>', '>')
这太长了......我只是想要一个有趣或def,这可以轻松解决问题。 非常感谢你
答案 0 :(得分:2)
>>> from HTMLParser import HTMLParser
>>> # from html.parser import HTMLParser # In Python 3.x
>>>
>>> parser = HTMLParser()
>>> parser.unescape('>_<')
u'>_<'
>>> parser.unescape('012')
u'012'
注意:HTMLParser.unescape(' ')
返回NO-BREAK SPACE(U + 00A0)而不是SPACE。
>>> parser.unescape(' ')
u'\xa0'
顺便说一句,不要将str
用作变量名,它会隐藏内置函数str
。