如何在python中解析不正确的转义字符串

时间:2014-12-12 18:34:41

标签: python json

我目前正在处理一个需要解析为Python的大型(2 gig)json文件。

问题是某些数据被不正确地转义,这给了我一个错误。

这是我的代码

import json

data = []
with open('full.json') as f:
for line in f:
    data.append(json.loads(line))

这给了我以下错误

ValueError: Invalid \escape: line 1 column 64 (char 63)

我打印出文件,找到了给我带来麻烦的行

{"page_viewed":"Truck Repair Form - \342\204\242"}

我知道它的\342\204\242部分阻碍了我,我只需要弄清楚如何正确地逃避反斜杠。

0 个答案:

没有答案