有没有更简单的方法将0xff01更改为\\ uff01?

时间:2015-01-18 13:35:52

标签: python python-3.x unicode

我想在Python控制台中打印所有全角字符。

import re
for i  in list(range(65281,65375)):
    x=hex(i)
    x='\\u'+re.search('.{4}$',x).group()
    x.encode("latin1").decode("unicode-escape")

我想让它变得更简单;重要的是将0xff01更改为\\uff01,这是我进行转换的方法。

x='0xff01'
'\\u'+re.search('.{4}$',x).group()

有更简单的方法吗?

1 个答案:

答案 0 :(得分:5)

您的代码以非常迂回的方式从整数生成单个Unicode字符。改为使用chr() function

for i  in range(65281, 65375):
    x = chr(i)

请注意,list()电话在这里非常多余且浪费;我删除了它。

来自文档:

  

返回表示Unicode代码点为整数 i 的字符的字符串。例如,chr(97)返回字符串'a'

演示:

>>> [chr(i) for i  in range(65281, 65375)]
['!', '"', '#', '$', '%', '&', ''', '(', ')', '*', '+', ',', '-', '.', '/', '0', '1', '2', '3', '4', '5', '6', '7', '8', '9', ':', ';', '<', '=', '>', '?', '@', 'A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J', 'K', 'L', 'M', 'N', 'O', 'P', 'Q', 'R', 'S', 'T', 'U', 'V', 'W', 'X', 'Y', 'Z', '[', '\', ']', '^', '_', '`', 'a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j', 'k', 'l', 'm', 'n', 'o', 'p', 'q', 'r', 's', 't', 'u', 'v', 'w', 'x', 'y', 'z', '{', '|', '}', '~']

如果您确实想要生成转义 \uhhhh序列(不将它们解释为实际的代码点),请使用str.format()将整数格式化为4位十六进制值:

for i in range(65281, 65375):
    x = '\\u{:04x}'.format(i)

前导0使格式为零填充,4将字段宽度设置为4个字符,x生成十六进制字符:

>>> ['\\u{:04x}'.format(i) for i  in range(65281, 65375)]
['\\uff01', '\\uff02', '\\uff03', '\\uff04', '\\uff05', '\\uff06', '\\uff07', '\\uff08', '\\uff09', '\\uff0a', '\\uff0b', '\\uff0c', '\\uff0d', '\\uff0e', '\\uff0f', '\\uff10', '\\uff11', '\\uff12', '\\uff13', '\\uff14', '\\uff15', '\\uff16', '\\uff17', '\\uff18', '\\uff19', '\\uff1a', '\\uff1b', '\\uff1c', '\\uff1d', '\\uff1e', '\\uff1f', '\\uff20', '\\uff21', '\\uff22', '\\uff23', '\\uff24', '\\uff25', '\\uff26', '\\uff27', '\\uff28', '\\uff29', '\\uff2a', '\\uff2b', '\\uff2c', '\\uff2d', '\\uff2e', '\\uff2f', '\\uff30', '\\uff31', '\\uff32', '\\uff33', '\\uff34', '\\uff35', '\\uff36', '\\uff37', '\\uff38', '\\uff39', '\\uff3a', '\\uff3b', '\\uff3c', '\\uff3d', '\\uff3e', '\\uff3f', '\\uff40', '\\uff41', '\\uff42', '\\uff43', '\\uff44', '\\uff45', '\\uff46', '\\uff47', '\\uff48', '\\uff49', '\\uff4a', '\\uff4b', '\\uff4c', '\\uff4d', '\\uff4e', '\\uff4f', '\\uff50', '\\uff51', '\\uff52', '\\uff53', '\\uff54', '\\uff55', '\\uff56', '\\uff57', '\\uff58', '\\uff59', '\\uff5a', '\\uff5b', '\\uff5c', '\\uff5d', '\\uff5e']