如何从Python中的json.loads获取错误位置

时间:2013-10-22 13:33:58

标签: python json

当我在Python 3中使用json.loads并捕获任何结果错误时,例如:

try:
  data = json.loads(string)
except ValueError as err:
  print(err)

我收到了一条有用的消息:

Expecting ',' delimiter: line 12 column 12 (char 271)

我希望能够向用户显示这一点,以及导致问题的确切位置(我正在阅读用户编写的JSON)。我怎样才能找到这一行和列?

我可以在err上使用正则表达式,但这感觉是个坏主意,因为我不知道这条消息是否国际化,并且可能会在不同版本的python中发生变化。还有更好的方法吗?

3 个答案:

答案 0 :(得分:9)

扫描json/decoder.py source code,我们可以看到解码器的错误消息是使用errmsg函数构建的:

def errmsg(msg, doc, pos, end=None):
    # Note that this function is called from _json
    lineno, colno = linecol(doc, pos)
    if end is None:
        fmt = '{0}: line {1} column {2} (char {3})'
        return fmt.format(msg, lineno, colno, pos)
        #fmt = '%s: line %d column %d (char %d)'
        #return fmt % (msg, lineno, colno, pos)
    endlineno, endcolno = linecol(doc, end)
    fmt = '{0}: line {1} column {2} - line {3} column {4} (char {5} - {6})'
    return fmt.format(msg, lineno, colno, endlineno, endcolno, pos, end)
    #fmt = '%s: line %d column %d - line %d column %d (char %d - %d)'
    #return fmt % (msg, lineno, colno, endlineno, endcolno, pos, end)

由于这是一个纯python模块,因此很容易使用自定义函数包装此函数。此过程称为monkey patching

import json

original_errmsg= json.decoder.errmsg

def our_errmsg(msg, doc, pos, end=None):
    json.last_error_position= json.decoder.linecol(doc, pos)
    return original_errmsg(msg, doc, pos, end)

json.decoder.errmsg= our_errmsg

try:
    data = json.loads('{1:}')
except ValueError as e:
    print("error at", json.last_error_position)

显然,这个解决方案并不理想,因为实施可能会随时改变,尽管它仍然比依赖消息更好。您应该在修补之前检查errmsg是否存在(并且可能没有其他参数,或者使用varargs)。

答案 1 :(得分:3)

如果您使用simplejson库,则会获得合格的JSONDecodeError

class JSONDecodeError(ValueError):
   """Subclass of ValueError with the following additional properties:

   msg: The unformatted error message
   doc: The JSON document being parsed
   pos: The start index of doc where parsing failed
   end: The end index of doc where parsing failed (may be None)
   lineno: The line corresponding to pos
   colno: The column corresponding to pos
   endlineno: The line corresponding to end (may be None)
   endcolno: The column corresponding to end (may be None)

   """

希望很快就会merged into stdlib

答案 2 :(得分:0)

如果json对象很小,请在此处过Json对象 http://jsonlint.com/ 它给了json打破的地方。