使用编解码器进行Python编码和解码,unicode_escape()

时间:2015-10-09 07:08:56

标签: python python-3.x

我正在尝试使用codecs库对python中的文本进行编码和解码。这是我的代码:

>>> import codecs
>>> codecs.unicode_escape_encode('my Text')
(b'my Text', 7)

然后,如何使用codecs.unicode_escape_decode()获取原始代码?我试过了:

>>> codecs.unicode_escape_decode("(b'my Text', 7)")
("(b'my Text', 7)", 15)

但它没有给'my text'。如果您需要更多详细信息,请告诉我。

1 个答案:

答案 0 :(得分:2)

我认为你将错误的东西粘贴回功能。 正确的用法是:

Sync

实际上更相关的例子是:

>>> import codecs
>>> codecs.unicode_escape_encode('my Text')
(b'my Text', 7)
>>> codecs.unicode_escape_decode(b'my Text')
('my Text', 7)

"正常"字母在编码和解码版本中都是1:1相同。 "特别"字母有时会占用多个字节,因此以编码格式表示,其十六进制数字例如>>> codecs.unicode_escape_encode('Hëllö') (b'H\\xebll\\xf6', 5) >>> codecs.unicode_escape_decode(b'H\\xebll\\xf6') ('Hëllö', 11) 代表编码形式的\\xeb

此处有更多信息:https://en.wikipedia.org/wiki/UTF-8