emojis是否占据明确定义的unicode范围?
并且,是否有一种确定的方法来检查代码点是否是python 2.7中的表情符号?
我似乎无法找到任何相关信息。有几个消息来源指出了这个范围:
\U0001f600-\U0001f650
但是,例如,有代码点
\U0001f918
超出此范围。
感谢。
答案 0 :(得分:5)
regex支持通过Unicode属性进行匹配,但遗憾的是它不支持emoji-specific properties。如果是这样,找到它们就会如此简单:
>>> regex.match(ur'\P{Emoji=yes}', u'') # NOTE: Doesn't (yet) work