在Python中使用反斜杠编码的非unicode 7位ASCII的Unicode字符串?

时间:2016-02-01 20:41:12

标签: python string encoding utf-8

环境: Python 2.6 ... Python 2.higher-than-6

我有正确的u'' UTF-8字符串,我需要在标准的Python 2.6-ish ASCII字符串中更改为ASCII编码格式。像这样:

def conversionSolution(utf8StringInput):
{
    ...
    return(asciiStringResult)
}

utf8string = u'\u5f00\u80c3\u83dc'
asciistring = conversionSolution(utf8string)
print asciistring

填写...后,上面会打印出来......

\ u5f00 \ u80c3 \ u83dc

......

开胃菜

让我强调一下,我想要这里的UTF-8;我特别要求0-127编码的ASCII反斜杠数据,我随后可以严格操作为7位ASCII。

2 个答案:

答案 0 :(得分:1)

您可以致电.encode('unicode-escape')来执行此操作。

话虽如此,你之后谈论的是操纵那个字符串。之后,您可以使用该字符串做很多有用的事情。例如。如果你切片,你可以在这些转义序列的中间切片。案例折叠当然不起作用,等等。如果你需要操作该字符串,你应该将它保存为unicode字符串。

答案 1 :(得分:1)

def conversionSolution(utf8StringInput):
    return repr(utf8StringInput)[2:][:-1]

utf8string = u'\u5f00\u80c3\u83dc'
asciistring = conversionSolution(utf8string)
print asciistring