假设我在变量中有俄语内容:
msg = '<some russian text here>'
print msg
给了我正确的价值但是
print [msg]
给了我这个:
['\xd0\x9f\xd0\xa4 "\xd0\x9a\xd0\xa2\xd0\x9f-\xd0\xa3\xd1\x80\xd0\xb0\xd0\xbb" (\xd0\x97\xd0\x90\xd0\x9e)']
如何将西里尔符号保留在列表中?
答案 0 :(得分:1)
你不能直接这样做,但你可以与pprint
非常接近。
https://stackoverflow.com/a/10883893/705086
中有示例代码它仅涵盖unicode类型,但可以像OP中一样轻松地适应utf-8编码的str / bytes。
理想情况下,pprint应该保持格式化/打印PDO是有效Python表达式的不变量。链接的代码也可以被黑客攻击以保持这种不变性。
你可以使用monkey-path pprint
模块来维护这个不变量:
import functools, pprint
def escape(s):
lead = ""
if isinstance(s, unicode):
s = s.encode("utf-8")
lead = "u"
return "%s\"%s\"" % (lead, s.replace("\\", "\\\\").replace("\"", "\\\""))
def patched(f):
if hasattr(f, "_already_patched"):
return f
@functools.wraps(f)
def sub(object, *args, **kwargs):
try:
if isinstance(object, basestring):
return escape(object), True, False
except Exception:
pass
return f(object, *args, **kwargs)
sub._already_patched = True
return sub
pprint._safe_repr = patched(pprint._safe_repr)
pprint.pprint([u"\N{EURO SIGN}", u"\N{EURO SIGN}".encode("utf-8")])
[u"€", "€"]