从文本中删除表情符号也删除日语

时间:2018-09-23 07:51:20

标签: python unicode emoji

我使用以下代码:

import re

def replace_emoji_space(string):
    emoji_pattern = re.compile("["
                       u"\U0001F600-\U0001F64F"  # emoticons
                       u"\U0001F300-\U0001F5FF"  # symbols & pictographs
                       u"\U0001F680-\U0001F6FF"  # transport & map symbols
                       u"\U0001F1E0-\U0001F1FF"  # flags (iOS)
                       u"\U00002702-\U000027B0"
                       u"\U000024C2-\U0001F251"
                       "]+", flags=re.UNICODE)
    return emoji_pattern.sub(r' ', string)

同时字符串=='趣味でバルーンひねってます' 结果只是一个空字符串,为什么?

这是我在pycharm中得到的: string in pyhon

1 个答案:

答案 0 :(得分:0)

import re

def replace_emoji_space(string):
    emoji_pattern = re.compile("["
                       u"\U0001F600-\U0001F64F"  # emoticons
                       u"\U0001F300-\U0001F5FF"  # symbols & pictographs
                       u"\U0001F680-\U0001F6FF"  # transport & map symbols
                       u"\U0001F1E0-\U0001F1FF"  # flags (iOS)
                       "]+", flags=re.UNICODE)
    return emoji_pattern.sub(r' ', string)

最后2个删除了日本人