如何在`ast.literal_eval`中调试错误?

时间:2017-10-25 13:40:09

标签: python python-2.7 serialization abstract-syntax-tree

我使用pprint.PrettyPrinter将数据写入文件,并尝试使用ast.literal_eval阅读。 这对我来说已经有一段时间了,我对所产生的文本表示感到满意。

但是,今天我在反序列化时遇到了这个错误:

  File "/...mypath.../store.py", line 82, in <lambda>
    reader=(lambda fd: ast.literal_eval(fd.read())),
  File "/usr/lib64/python2.7/ast.py", line 80, in literal_eval
    return _convert(node_or_string)
  File "/usr/lib64/python2.7/ast.py", line 60, in _convert
    return list(map(_convert, node.elts))
  File "/usr/lib64/python2.7/ast.py", line 63, in _convert
    in zip(node.keys, node.values))
  File "/usr/lib64/python2.7/ast.py", line 62, in <genexpr>
    return dict((_convert(k), _convert(v)) for k, v
  File "/usr/lib64/python2.7/ast.py", line 63, in _convert
    in zip(node.keys, node.values))
  File "/usr/lib64/python2.7/ast.py", line 62, in <genexpr>
    return dict((_convert(k), _convert(v)) for k, v
  File "/usr/lib64/python2.7/ast.py", line 79, in _convert
    raise ValueError('malformed string')
ValueError: malformed string

如何修复此特定文件?

有问题的文件是17k行/ 700kb。 我将它加载到Emacs中 - parens是平衡的。 文件中没有非ASCII字符。 我可以“分而治之”(将文件分成两半并尝试实现每一半) - 但这是相当繁琐的。 还有什么更好的吗?

我修改了ast.literal_eval:_convert以打印违规节点 - 结果是<_ast.UnaryOp object at 0x110696510>。不是很有帮助。

我如何确保将来不会发生这种情况?

我希望JSON不是答案。 ; - )

我没有使用JSON,因为

  1. JSON cannot handle non-string dict keys
  2. JSON inserts either too many newlines or none at all

1 个答案:

答案 0 :(得分:2)

快速和肮脏

应用此补丁:

--- /...../2.7/lib/python2.7/ast.py.old 2018-03-25 12:17:11.000000000 -0400
+++ /...../2.7/lib/python2.7/ast.py 2018-03-25 12:17:18.000000000 -0400
@@ -76,7 +76,7 @@ def literal_eval(node_or_string):
                 return left + right
             else:
                 return left - right
-        raise ValueError('malformed string')
+        raise ValueError('malformed string', node.lineno, node.col_offset)
     return _convert(node_or_string)

重新加载ast

>>> reload(ast)

重试加载有问题的文件

获取

ValueError: ('malformed string', 21161, 10)

然后是第21161行,第10列是错误所在的位置。

先进

将代码包裹在try/except中,捕获错误并使用inspect / traceback访问相关的node

try:
    ast.literal_eval(...)
except ValueError as ex:
    _exc_type, exc_value, exc_traceback = sys.exc_info()
    print("ERROR: %r" % (exc_value))
    # traceback.print_tb(exc_traceback)
    last_tb = exc_traceback
    while last_tb.tb_next:
        last_tb = last_tb.tb_next
    print("Error location: line=%d, col=%d" % (
        last_tb.tb_frame.f_locals["node"].lineno,
        last_tb.tb_frame.f_locals["node"].col_offset))

打印

ERROR: ValueError('malformed string')
Error location: line=21933, col=15