如何在python中访问部分编码(gb18020)字符串

时间:2018-01-27 23:59:01

标签: python encoding

我在python中使用gb18030编码中文字符。我想访问部分编码字符串。例如,李的字符串是:'\ xc0 \ xee'。我想从中提取'c0'和'ee'。但是,python不会将'\ xc0 \ xee'视为8个字符的字符串,而是将其视为2个字符的字符串。我怎么把它变成8个字符的字符串,以便我可以访问其中的单个罗马字母?

2 个答案:

答案 0 :(得分:1)

找到解决方案。 repr()会做的。

答案 1 :(得分:0)

这个怎么样:

li = "李"
values = str(li.encode('gb18030'))
values = [i.strip("'") for i in values.split("\\x")[1:]]
print(values)
['c0', 'ee']

如何使用repr()获取您要查找的值?