如何使用任何语言修复txt文件中的JSON数据的错误?

时间:2015-08-26 07:51:26

标签: json parsing twitter

我从Twitter API 1.1获取JSON格式的推文信息,并将它们保存在txt文件中。但有些线路有错误。在这里你可以看到;



{
"data":
[
   {
    "created_at": "Fri Jul 24 17:40:54 +0000 2015",
    "id": 624635378344030200,
    "id_str": "624635378344030208",
    "text": "#FollowFriday @ragalan1974 @DiazCueto @ecoinnovatic for being top",
    "source": "<a href="https://commun.it" rel="nofollow">Commun.it</a>",
    "truncated": false
    }
 ]
}
&#13;
&#13;
&#13;

&#34;源&#34;对象包含引号。所以我无法解析。我需要删除这些引号。应该是这样的;

&#13;
&#13;
"source": "<a href=https://commun.it rel=nofollow>Commun.it</a>",
&#13;
&#13;
&#13;

我试图在Java中替换这些(从txt中读取 - 替换并写入.txt)并且它可以正常工作但每个推文的来源可能不同(例如,Commun.it,Android推特,IOS推特,网络浏览器,移动网络浏览器或各种应用程序。)所以我无法手动控制所有的人。当然,必须有一个解决方案让所有人删除这些报价。 任何帮助将不胜感激。

1 个答案:

答案 0 :(得分:0)

要纠正它,最好的解决方案是通过一个程序来完成,我的建议是使用正则表达式,这样你就能找到并修改这些确切的模式。

但是你不会删除引号,你将会逃脱它们,就像这样:

 "source": "<a href=\"https://commun.it\" rel=\"nofollow\">Commun.it</a>",