Python3:转换撇号unicode字符串

时间:2018-12-04 01:39:37

标签: python-3.x unicode-string unicode-escapes

我有一个带有撇号的字符串值,

"I\\xE2\\x80\\x99m going now."

如何获得正确的撇号值?

"I`m going now."

如您所知,\xE2\x80\x99是一个Unicode字符U+2019 RIGHT SINGLE QUOTATION MARK,但是我使用的是字符串表示形式,而不是字节...

1 个答案:

答案 0 :(得分:0)

也许这就是您想要的:

utf8_apostrophe = b'\xe2\x80\x99'.decode("utf8")
str = "I"+utf8_apostrophe+"m going now"

除了: 在将UTF-8编码的推文中的单引号转换为普通的单引号时,我遇到了这个问题。

import re
original_tweet = 'I’m going now'
string_apostrophe = "'"
print re.sub(utf8_apostrophe, string_apostrophe, original_tweet)

产生

I'm going now