如何在Python中将unicode字符转义为符号实体名称?

时间:2011-08-13 16:33:20

标签: python escaping

我想要实现的是

Í -> í
ø -> ø
ñ -> ñ
...

在python中是否有一种标准方法,或者我是否必须创建自己的字典并使用它来手动逐字逐句地转换字符?

我在SO上找到了很多相反的提示,但没有一个能解决我的问题。

2 个答案:

答案 0 :(得分:3)

您正在寻找htmlentitydefs

In [217]: import htmlentitydefs

In [224]: ['&'+htmlentitydefs.codepoint2name[ord(x)]+';' for x in u'Íøñ']
Out[224]: ['Í', 'ø', 'ñ']

答案 1 :(得分:1)

试试这个:

import htmlentitydefs

def EscapeUnicode(character):
    return "&%s;" % htmlentitydefs.codepoint2name[ord(character)]