Python unicode打印格式

时间:2017-09-19 13:34:10

标签: python unicode formatting

我有一个简单的Python(2.7)脚本,它读取数据库表并吐出行。最初没有必要使用unicode,脚本就是这样:

users = config.Session.query(User).order_by(User.id).all()
for _f in users:
    print "{0:6d}   {1:20}  {2:30}    {3:}".format(_f.id, _f.foo, _f.name, _f.url)

这很好用,并生成了这样的整齐格式的输出:

   739   42352                 Foo Bar                           https://...
   740   23555                 Another User                      https://...
   741   774577                Third User                        https://...

然后我们开始在数据库中添加重音名称。最初,脚本开始引发关于ascii编解码器的异常,对事情不满意。

我试图修复脚本,我这样做了。我摆脱了异常,但现在名称中的每个重音字符似乎都计为double,导致URL字段为N个字符,N是名称中重音字符的数量。

for _f in users:
    uname = _f.name.encode('utf-8')
    print "{0:6d}   {1:20}  {2:30}    {3:}".format(_f.id, _f.foo, uname, _f.url)

输出现在是这样的:

   739   42352                 Foo Bar                           https://...
   740   23555                 Änöther User                    https://...
   741   774577                Third User                        https://...

我需要在格式化字符串中添加什么才能使其正确计算带有重音字符的unicode字符串的长度?

1 个答案:

答案 0 :(得分:2)

使用多字节UTF-8编码打印字节字符串是个问题。不要对它进行编码,使用Unicode字符串,例如print u"{0:6d}..."

示例:

print "1234567890"*3
print "{0:20}  xxx".format(u"Another User")
print "{0:20}  xxx".format(u"Änöther User".encode('utf8'))
print u"{0:20}  xxx".format(u"Änöther User")

输出:

123456789012345678901234567890
Another User          xxx
Änöther User        xxx
Änöther User          xxx