在两个不同的IDE /编辑器中,Unicode编码的行为有所不同

时间:2018-09-24 02:54:59

标签: python character-encoding visual-studio-code pycharm python-unicode

环境规格:

OS:Windows 10

Python解释器:3.7

PyCharm:CE。2018.2.4

VS代码:1.27.1

在编写Python代码和偶尔使用PyCharm时,我主要使用VS Code。今天我遇到一个问题,我有一段代码:

s = 'ياخشىمۇسىز'
b = bytes(s, encoding='utf-8')
print(b)
x = str(b, encoding='utf-8')
print(x)

如果我在VS Code中运行此代码,则会出现以下错误:

UnicodeEncodeError: 'charmap' codec can't encode characters in position 0-4: character maps to <undefined>

但是如果我在PyCharm中运行相同的代码,则会得到:

b'\xd9\x8a\xd8\xa7\xd8\xae\xd8\xb4\xd9\x89\xd9\x85\xdb\x87\xd8\xb3\xd9\x89\xd8\xb2'
ياخشىمۇسىز

因此编码只能在一个编辑器中工作,而不能在其他编辑器中工作,我不知道这取决于编辑器。谁能对此有所启发?

0 个答案:

没有答案