我有一个带有撇号的字符串值,
"I\\xE2\\x80\\x99m going now."
如何获得正确的撇号值?
"I`m going now."
如您所知,\xE2\x80\x99
是一个Unicode字符U+2019 RIGHT SINGLE QUOTATION MARK
,但是我使用的是字符串表示形式,而不是字节...
答案 0 :(得分:0)
也许这就是您想要的:
utf8_apostrophe = b'\xe2\x80\x99'.decode("utf8")
str = "I"+utf8_apostrophe+"m going now"
除了: 在将UTF-8编码的推文中的单引号转换为普通的单引号时,我遇到了这个问题。
import re
original_tweet = 'I’m going now'
string_apostrophe = "'"
print re.sub(utf8_apostrophe, string_apostrophe, original_tweet)
产生
I'm going now