无法从Wiki阅读日语内容

时间:2013-05-02 18:21:32

标签: java parsing encoding mediawiki

我正在尝试使用以下代码从Wiki

中读取日语内容
ClientConfig clientConfig = new DefaultClientConfig();
client = Client.create(clientConfig);
WebResource webResource = client.resource("http://ja.wikipedia.org/w/api.php?format=json&action=query&titles=AKB48&rvprop=content&prop=revisions");
String s  = webResource.get(String.class);          
System.out.println(s);

结果就像

{"query":{"pages":{"2276803":{"pageid":2276803,"ns":0,"title":"AKB48","revisions":[{"contentformat":"text/x-wiki","contentmodel":"wikitext","*":"{{Otheruseslist|\u65e5\u672c\u306e\u5973\u6027\u30a2\u30a4\u30c9\u30eb\u30b0\u30eb\u30fc\u30d7....

它显示\ uxxx而不是真正的日语单词。我知道它必须是编码问题。但我仍然无法使其发挥作用。

非常感谢任何帮助。

1 个答案:

答案 0 :(得分:5)

对我来说,这看起来是完全合理的JSON。与Java一样,JSON使用\u转义序列来表示字符。我认为这根本不是编码问题。

我建议您找到一个带有您喜欢的API的JSON解析器,将字符串插入其中,然后您就可以获取“未转义”值。