我从网站下载rss feed的数据后,我有编码问题。某些角色无法正确解释。 我使用HttpResponse.getEntity()并放入循环读取inputStream并写入ByteArrayOutPutStream。
E.g。 ByteArrayOutPutStream bs; 在“bs”上写后,我使用String test = bs.toString(“UTF-8”);
然而,有些角色是这样的:Mytestï¼è¾å¸éï¼å°±è¢«æèªé²å¥é»åéμ件系çμ±ä¸äºé祥¢ææ我不能转换那些角色,任何想法。
谢谢
答案 0 :(得分:4)
它不是UTF-8
编码,可能是Big5
编码(您的问题历史记录证实您来自中国/香港)。
MYTEST簿翘痴职畴绣蒙簿翘畴箪篑痴瞽窜疆痴秾蒙简畴睑蒙坛畴箫蒙缮瓣坛绕瘪粮坛瘪缮篑瓣绣瓣翻蒙瘪睑畴簧瞽疆绕
您应该可以自己阅读HttpEntity#getContentType()
来确定。它应该返回类似
text/html;charset=Big5