解析YAML并假设某个路径始终是一个字符串

时间:2010-10-06 18:12:38

标签: python yaml pyyaml

我正在使用http://pyyaml.org中的YAML解析器,我希望它始终将某些字段解释为字符串,但我无法弄清楚add_path_resolver()是如何工作的。

例如:解析器假定“version”是float:

network:
- name: apple
- name: orange
version: 2.3
site: banana

有些文件有“version:2”(被解释为int)或“version:2.3 alpha”(被解释为str)。

我希望它们始终被解释为str。

似乎yaml.add_path_resolver()应该让我指定,“当你看到版本:时,总是把它解释为str)但是没有记录得很好。我最好的猜测是:

yaml.add_path_resolver(u'!root', ['version'], kind=str)

但这不起作用。

有关如何让我的版本字段始终为字符串的建议?

P.S。以下是不同“版本”字符串的一些示例以及它们的解释方式:

(Pdb) import yaml
(Pdb) import pprint
(Pdb) pprint.pprint(yaml.load("---\nnetwork:\n- name: apple\n- name: orange\nversion: 2\nsite: banana"))
{'network': [{'name': 'apple'}, {'name': 'orange'}],
 'site': 'banana',
 'version': 2}
(Pdb) pprint.pprint(yaml.load("---\nnetwork:\n- name: apple\n- name: orange\nversion: 2.3\nsite: banana"))
{'network': [{'name': 'apple'}, {'name': 'orange'}],
 'site': 'banana',
 'version': 2.2999999999999998}
(Pdb) pprint.pprint(yaml.load("---\nnetwork:\n- name: apple\n- name: orange\nversion: 2.3 alpha\nsite: banana"))
{'network': [{'name': 'apple'}, {'name': 'orange'}],
 'site': 'banana',
 'version': '2.3 alpha'}

2 个答案:

答案 0 :(得分:2)

从目前来源:

 # Note: `add_path_resolver` is experimental.  The API could be changed.

看来它还没完整(还有?)。 的语法(据我所知)是:

yaml.add_path_resolver(u'tag:yaml.org,2002:str', ['version'], yaml.ScalarNode)

然而,它没有。

似乎首先检查隐式类型解析器,如果匹配,则它永远不会检查用户定义的解析器。有关详细信息,请参阅resolver.py(查找函数resolve)。

我建议您将version条目更改为

version: !!str 2.3

这将始终强制它为字符串。

答案 1 :(得分:0)

到目前为止,最简单的解决方案是不使用基本.load()(无论如何都是不安全的),而是将其与Loader=BaseLoader一起使用,它将每个标量加载为字符串:

import yaml

yaml_str = """\
network:
- name: apple
- name: orange
version: 2.3
old: 2
site: banana
"""

data = yaml.load(yaml_str, Loader=yaml.BaseLoader)
print(data)

给出:

{'network': [{'name': 'apple'}, {'name': 'orange'}], 'version': '2.3', 'old': '2', 'site': 'banana'}