我从Twitter API 1.1获取JSON格式的推文信息,并将它们保存在txt文件中。但有些线路有错误。在这里你可以看到;
{
"data":
[
{
"created_at": "Fri Jul 24 17:40:54 +0000 2015",
"id": 624635378344030200,
"id_str": "624635378344030208",
"text": "#FollowFriday @ragalan1974 @DiazCueto @ecoinnovatic for being top",
"source": "<a href="https://commun.it" rel="nofollow">Commun.it</a>",
"truncated": false
}
]
}
&#13;
&#34;源&#34;对象包含引号。所以我无法解析。我需要删除这些引号。应该是这样的;
"source": "<a href=https://commun.it rel=nofollow>Commun.it</a>",
&#13;
我试图在Java中替换这些(从txt中读取 - 替换并写入.txt)并且它可以正常工作但每个推文的来源可能不同(例如,Commun.it,Android推特,IOS推特,网络浏览器,移动网络浏览器或各种应用程序。)所以我无法手动控制所有的人。当然,必须有一个解决方案让所有人删除这些报价。 任何帮助将不胜感激。
答案 0 :(得分:0)
要纠正它,最好的解决方案是通过一个程序来完成,我的建议是使用正则表达式,这样你就能找到并修改这些确切的模式。
但是你不会删除引号,你将会逃脱它们,就像这样:
"source": "<a href=\"https://commun.it\" rel=\"nofollow\">Commun.it</a>",