解析yaml文件时出错:找到字符'%'无法启动任何令牌

时间:2017-02-16 09:27:29

标签: yaml ruamel.yaml

我试图解析yaml文件中的数据,其中包含一些类似于jinaj2模板语法的表达式,目的是删除或添加一些项目到文件中。

AddCodesList.yaml

AddCodesList:
  body:
    list:
    {% for elt in customer %}
      - code: {{ elt.code }}
        name: {{ elt.name }}
        country: {{ elt.country }}
    {% endfor %}   
  result:
    json:
      responseCode: {{ responseCode }}
      responseMsg: {{ responseMsg }}
      responseData: {{ responseData }}

parseFile.py

import ruamel.yaml
from ruamel.yaml.util import load_yaml_guess_indent

data,indent,block_seq_indent=load_yaml_guess_indent(open('AddCodesList.yaml'), preserve_quotes=True)

#delete item
del data['body']['list']['code']
#add new item
data['parameters'].insert(2, 'ssl_password','xxxxxx')#create new file
ruamel.yaml.round_trip_dump(data, open('missingCode.yaml', 'w'), explicit_start=True)

执行parseFile.py脚本时出现以下错误:

    Traceback (most recent call last):
      File "d:/workspace/TEST/manageItem.py", line 4, in <module>
        data, indent, block_seq_indent = load_yaml_guess_indent(open('AddCodesList.
...
        if self.check_token(ValueToken):
      File "C:\Python34\lib\site-packages\ruamel\yaml\scanner.py", line 1534, in ch
        self.fetch_more_tokens()
      File "C:\Python34\lib\site-packages\ruamel\yaml\scanner.py", line 269, in fet
        % utf8(ch), self.get_mark())
    ruamel.yaml.scanner.ScannerError: while scanning for the next token
    found character '%' that cannot start any token
      in "<unicode string>", line 4, column 6:
            {% for elt in customer %}
             ^ (line: 4)

2 个答案:

答案 0 :(得分:1)

在YAML中,'{'启动流式样式映射,因此(%)将成为该映射的第一个键的开头,并且不允许该字符作为第一个字符。

通常,您将首先处理文件的模板,然后应用YAML。您不能轻易地反转该过程,因为list的值必须是有效的YAML构造。

使其可解析的解决方案之一是将list的值更改为有效的YAML,如:

list:
  - {% for elt in customer %}
  - code: {{ elt.code }}
    name: {{ elt.name }}
    country: {{ elt.country }}
  - {% endfor %} 

或:

list: |
    {% for elt in customer %}
      - code: {{ elt.code }}
        name: {{ elt.name }}
        country: {{ elt.country }}
    {% endfor %} 

这将不再使其成为可模板化的bij jinja2。

您可以从{%更改jinja2中的开始顺序,但这对您没有帮助(即您仍然无法获得有效的YAML)。我现在看到的唯一真正的解决方案是完全放弃jinja2并使用Python中的一些像对象一样实现for循环(在访问时扩展)。

如果允许在应用jinja2之前始终进行预处理,则可以将文件更改为:

AddCodesList:
  body:
    list:
    # {% for elt in customer %}
      - code: '{{ elt.code }}'
        name: '{{ elt.name }}'
        country: '{{ elt.country }}'
    # {% endfor %}   

因为会加载,但您可能需要在运行模板引擎之前将# b{更改为{

引用单引号,因为只有单引号具有特殊含义。使用双引号你经常会得到预处理器插入的东西,使得YAML不正确(例如DOS / Windows样式的完整文件路径:'C:\yaml\abc.yaml'是正确的但"c:\yaml\abc.yaml"会给你一个错误在YAML解析期间。

答案 1 :(得分:0)

问题通过以下结构解决:

AddCodesList:
  body:
    list:
    # {% for elt in customer %}
      - code: "{{ elt.code }}"
        name: "{{ elt.name }}"
        country: "{{ elt.country }}"
    # {% endfor %}