应用错误收集

给PEP 263带来的理由

时间：2015-01-28 23:20:26

标签： python unicode python-2.x python-2.3

我正在阅读PEP 263并且我被困在这一段：

在Python 2.1中，Unicode文字只能使用基于Latin-1的编码“unicode-escape”。这使得编程环境对生活的Python用户不太友好并且在非拉丁语1区域工作，例如许多亚洲人国家。程序员可以使用。编写8位字符串最喜欢的编码，但是绑定到“unicode-escape”编码用于Unicode文字。

“unicode-escape”是什么意思？来自亚洲的人是如何编写python文件的？有人能告诉我他们如何在python 2.3之前编写python源代码吗？我只是不明白为什么会引入PEP 263：我在我的机器python 2.1.3上安装并启动了python cod.py，其中cod.py是一个用utf-8编码的文件，所有工作都很好。 / p>

1 个答案:

答案 0 :(得分：1)

Unicode-escape是'\xab'形式的字符，\x表示接下来的两个字符并将它们解释为十六进制代码以生成单个字符。

亚洲语言中的字符通常占用多个字节，因此例如字符草可能是'\xe8\x8d\x89'。

您不能在源代码中使用这些字符，除非作为字符串文字的一部分（或者可能是注释）。