我目前正在处理一个需要解析为Python的大型(2 gig)json文件。
问题是某些数据被不正确地转义,这给了我一个错误。
这是我的代码
import json
data = []
with open('full.json') as f:
for line in f:
data.append(json.loads(line))
这给了我以下错误
ValueError: Invalid \escape: line 1 column 64 (char 63)
我打印出文件,找到了给我带来麻烦的行
{"page_viewed":"Truck Repair Form - \342\204\242"}
我知道它的\342\204\242
部分阻碍了我,我只需要弄清楚如何正确地逃避反斜杠。