我正在使用http://pyyaml.org中的YAML解析器,我希望它始终将某些字段解释为字符串,但我无法弄清楚add_path_resolver()是如何工作的。
例如:解析器假定“version”是float:
network:
- name: apple
- name: orange
version: 2.3
site: banana
有些文件有“version:2”(被解释为int)或“version:2.3 alpha”(被解释为str)。
我希望它们始终被解释为str。
似乎yaml.add_path_resolver()应该让我指定,“当你看到版本:时,总是把它解释为str)但是没有记录得很好。我最好的猜测是:
yaml.add_path_resolver(u'!root', ['version'], kind=str)
但这不起作用。
有关如何让我的版本字段始终为字符串的建议?
P.S。以下是不同“版本”字符串的一些示例以及它们的解释方式:
(Pdb) import yaml
(Pdb) import pprint
(Pdb) pprint.pprint(yaml.load("---\nnetwork:\n- name: apple\n- name: orange\nversion: 2\nsite: banana"))
{'network': [{'name': 'apple'}, {'name': 'orange'}],
'site': 'banana',
'version': 2}
(Pdb) pprint.pprint(yaml.load("---\nnetwork:\n- name: apple\n- name: orange\nversion: 2.3\nsite: banana"))
{'network': [{'name': 'apple'}, {'name': 'orange'}],
'site': 'banana',
'version': 2.2999999999999998}
(Pdb) pprint.pprint(yaml.load("---\nnetwork:\n- name: apple\n- name: orange\nversion: 2.3 alpha\nsite: banana"))
{'network': [{'name': 'apple'}, {'name': 'orange'}],
'site': 'banana',
'version': '2.3 alpha'}
答案 0 :(得分:2)
从目前来源:
# Note: `add_path_resolver` is experimental. The API could be changed.
看来它还没完整(还有?)。 的语法(据我所知)是:
yaml.add_path_resolver(u'tag:yaml.org,2002:str', ['version'], yaml.ScalarNode)
然而,它没有。
似乎首先检查隐式类型解析器,如果匹配,则它永远不会检查用户定义的解析器。有关详细信息,请参阅resolver.py(查找函数resolve
)。
我建议您将version
条目更改为
version: !!str 2.3
这将始终强制它为字符串。
答案 1 :(得分:0)
到目前为止,最简单的解决方案是不使用基本.load()
(无论如何都是不安全的),而是将其与Loader=BaseLoader
一起使用,它将每个标量加载为字符串:
import yaml
yaml_str = """\
network:
- name: apple
- name: orange
version: 2.3
old: 2
site: banana
"""
data = yaml.load(yaml_str, Loader=yaml.BaseLoader)
print(data)
给出:
{'network': [{'name': 'apple'}, {'name': 'orange'}], 'version': '2.3', 'old': '2', 'site': 'banana'}