我有
>>> import yaml
>>> yaml.dump(u'abc')
"!!python/unicode 'abc'\n"
但我想要
>>> import yaml
>>> yaml.dump(u'abc', magic='something')
'abc\n'
什么神奇的参数强制没有标记?
答案 0 :(得分:85)
您可以使用safe_dump
代替dump
。请记住,它无法表示任意Python对象。此外,当您{Y} load
时,您将获得str
个对象而不是unicode
。
答案 1 :(得分:18)
这个怎么样:
def unicode_representer(dumper, uni):
node = yaml.ScalarNode(tag=u'tag:yaml.org,2002:str', value=uni)
return node
yaml.add_representer(unicode, unicode_representer)
这似乎使得转储unicode对象与为我转储str对象的工作方式相同(Python 2.6)。
In [72]: yaml.dump(u'abc')
Out[72]: 'abc\n...\n'
In [73]: yaml.dump('abc')
Out[73]: 'abc\n...\n'
In [75]: yaml.dump(['abc'])
Out[75]: '[abc]\n'
In [76]: yaml.dump([u'abc'])
Out[76]: '[abc]\n'
答案 2 :(得分:4)
您需要一个新的转储程序类,它可以执行标准Dumper类所做的所有操作,但会覆盖str和unicode的表示符。
from yaml.dumper import Dumper
from yaml.representer import SafeRepresenter
class KludgeDumper(Dumper):
pass
KludgeDumper.add_representer(str,
SafeRepresenter.represent_str)
KludgeDumper.add_representer(unicode,
SafeRepresenter.represent_unicode)
导致
>>> print yaml.dump([u'abc',u'abc\xe7'],Dumper=KludgeDumper)
[abc, "abc\xE7"]
>>> print yaml.dump([u'abc',u'abc\xe7'],Dumper=KludgeDumper,encoding=None)
[abc, "abc\xE7"]
当然,我仍然对如何保持这种漂亮感到难过。
>>> print u'abc\xe7'
abcç
它打破了后来的yaml.load()
>>> yy=yaml.load(yaml.dump(['abc','abc\xe7'],Dumper=KludgeDumper,encoding=None))
>>> yy
['abc', 'abc\xe7']
>>> print yy[1]
abc�
>>> print u'abc\xe7'
abcç
答案 3 :(得分:2)
除了interjay的优秀答案之外,如果你负责文件编码,你可以保持你的unicode重新加载。
# -*- coding: utf-8 -*-
import yaml
import codecs
data = dict(key = u"abcç\U0001F511")
fn = "test2.yaml"
with codecs.open(fn, "w", encoding="utf-8") as fo:
yaml.safe_dump(data, fo)
with codecs.open(fn, encoding="utf-8") as fi:
data2 = yaml.safe_load(fi)
print ("data2:", data2, "type(data.key):", type(data2.get("key")) )
print data2.get("key")
我的编辑器中的test2.yaml 内容:
{key: "abc\xE7\uD83D\uDD11"}
打印输出:
('data2:', {'key': u'abc\xe7\U0001f511'}, 'type(data.key):', <type 'unicode'>)
abcç
另外,在阅读http://nedbatchelder.com/blog/201302/war_is_peace.html后,我非常确定safe_load / safe_dump是我想要的地方。
答案 4 :(得分:0)
我刚开始使用Python和YAML,但这可能也有帮助。只需比较输出:
def test_dump(self):
print yaml.dump([{'name': 'value'}, {'name2': 1}], explicit_start=True)
print yaml.dump_all([{'name': 'value'}, {'name2': 1}])