print u'<'
如何打印<
print '>'
如何打印>
答案 0 :(得分:16)
您应该使用HTMLParser
模块decode html:
>>> import HTMLParser
>>> h= HTMLParser.HTMLParser()
>>> h.unescape('alpha < β')
u'alpha < \u03b2'
要转义HTML,cgi module is fine:
>>> cgi.escape(u'<a>bá</a>').encode('ascii', 'xmlcharrefreplace')
'<a>bá</a>