我想要实现的是
Í -> í
ø -> ø
ñ -> ñ
...
在python中是否有一种标准方法,或者我是否必须创建自己的字典并使用它来手动逐字逐句地转换字符?
我在SO上找到了很多相反的提示,但没有一个能解决我的问题。
答案 0 :(得分:3)
您正在寻找htmlentitydefs:
In [217]: import htmlentitydefs
In [224]: ['&'+htmlentitydefs.codepoint2name[ord(x)]+';' for x in u'Íøñ']
Out[224]: ['Í', 'ø', 'ñ']
答案 1 :(得分:1)
试试这个:
import htmlentitydefs
def EscapeUnicode(character):
return "&%s;" % htmlentitydefs.codepoint2name[ord(character)]