我是python的新手,目前我正在使用需要在用户评论中分析表情符号的项目。 他们需要在字符串中用他们的unicode值替换emojis。 这是我的代码
import re
RE_EMOJI = re.compile('[\U00010000-\U0010ffff]', flags=re.UNICODE)
def strip_emoji(text):
return RE_EMOJI.sub(r'', text)
print(strip_emoji('hi '))
示例输出
hi
此代码删除字符串上的表情符号,但我需要用它们的unicode值替换它们。
预期输出
hi U0001F600 U0001F601