我想获得表情符号的unicode表示。
使用以下代码段我可以得到它
emoji_rep = unicode('', 'utf-8').encode('unicode_escape')
emoji_rep
的值为\U0001f605
但是,我只希望结果为1f605
。是否有一种pythonic /优雅的方法来解决这个问题?此外,一些表情符号具有unicode值,例如\u270b\U0001f3fe
。表示它的更好方法是270b+1f3fe
。
答案 0 :(得分:1)
您可以使用ord(u'')
获取代码点。如果您愿意,可以将其转换为十六进制:例如。通过hex(ord(u''))
或"{:x}".format(ord(u''))
。
注意Unicode代码点的最常见十六进制表示为U+270B
(4位),代码点低于0x10000,U+01F3FE
(6位)代表其他代码点。