需要用他们的Unicode值替换表情符号字符

时间:2018-04-01 08:15:19

标签: python regex python-3.x unicode emoji

我是python的新手,目前我正在使用需要在用户评论中分析表情符号的项目。 他们需要在字符串中用他们的unicode值替换emojis。 这是我的代码

import re

RE_EMOJI = re.compile('[\U00010000-\U0010ffff]', flags=re.UNICODE)

def strip_emoji(text):
    return RE_EMOJI.sub(r'', text)

print(strip_emoji('hi '))

示例输出

 hi

此代码删除字符串上的表情符号,但我需要用它们的unicode值替换它们。

预期输出

hi U0001F600 U0001F601

0 个答案:

没有答案