循环显示unicode字符串的字符,显示意外的代码点

时间:2017-10-14 18:30:52

标签: python unicode emoji

例如:

x = u'\U0001f622'
[c for c in x]

返回[u'\ud83d', u'\ude22']而不是预期的[u'\ U0001f622']。

\U0001f622是一个表情符号,因为我有一个表情符号,我试图在文本中检测表情符号,我需要循环捕获\U0001f622而不是组合u'\ud83d', u'\ude22'

我正在使用python 2.7。根据{{​​3}} u'\ud83d', u'\ude22'是该表情符号的C / C ++ / Java源代码。

我该怎么做? 感谢。

0 个答案:

没有答案