我的数据如下:
"贡献者":null, "截断":false, " text":"这是"什么"我们称之为文字", "坐标":null
注意" text"的现有双引号内的双引号节点(坏数据,我知道)。数据集很大,因此手动清理是不可能的。我使用Node.js流式传输数据,因此我可以逐行进行替换。有没有办法让JS逃脱(或改为单引号)这些实例?任何援助将不胜感激。感谢
答案 0 :(得分:0)
不使用Node.js,因为您需要一个lookbehind断言来否定有效的JSON架构字符(:
和,
)。
你可以这样做,比如Python。它不会抓住所有东西,你可能不得不做一些手动清理:
(?<![:,] )"(?![:,])
如果您需要,请展开:https://regex101.com/r/rB4vV9/1
相关:为什么你的数据源没有吐出有效的JSON,为什么你没有敲开主人的门,告诉他们他们做错了?