从unicode中删除零填充

时间:2015-10-11 23:05:25

标签: python python-2.7 unicode emoji

我想获得表情符号的unicode表示。

使用以下代码段我可以得到它

emoji_rep = unicode('', 'utf-8').encode('unicode_escape')

emoji_rep的值为\U0001f605 但是,我只希望结果为1f605。是否有一种pythonic /优雅的方法来解决这个问题?此外,一些表情符号具有unicode值,例如\u270b\U0001f3fe。表示它的更好方法是270b+1f3fe

1 个答案:

答案 0 :(得分:1)

您可以使用ord(u'')获取代码点。如果您愿意,可以将其转换为十六进制:例如。通过hex(ord(u''))"{:x}".format(ord(u''))

注意Unicode代码点的最常见十六进制表示为U+270B(4位),代码点低于0x10000,U+01F3FE(6位)代表其他代码点。