如何在Python中替换或删除UTF-8编码的Twitter表情符号

时间:2019-05-15 04:44:09

标签: python-3.6

这是我的问题

我已经尝试使用此代码将其删除,但无效

words = ' '.join(re.sub("(@[A-Za-z0-9]+)|([^0-9A-Za-z \t])|(\w+:\/\/\S+)"," ",words).split())
words2 = ' '.join(re.sub("(@[A-Za-z0-9]+)|([^0-9A-Za-z \t])|(\w+:\/\/\S+)"," ",words2).split())

我正在尝试删除\xe2\x80\x9cIt\xe2\x80\x99s

b'\xe2\x80\x9cIt\xe2\x80\x99s对我们来说只是梦想成真,\xe2\x80\x9dPe\xe2\x80\xa6

赞助的The Old Man,亚洲最佳酒吧2019年的Agung Prabowo说

我想要输出

"Agung Prabowo of The Old Man The Best Bar in Asia 2019 sponsored by"

0 个答案:

没有答案