在java中将utf8转换为gb2312

时间:2015-11-05 02:22:22

标签: java utf-8 gb2312

请看下面的代码

try {
        String str = "上海上海";
        String gb2312 = new String(str.getBytes("utf-8"), "gb2312");
        String utf8 = new String(gb2312.getBytes("gb2312"), "utf-8");
        System.out.println(str.equals(utf8));
    } catch (UnsupportedEncodingException e) {
        e.printStackTrace();
    }

打印错误!!!

我在jdk7和jdk8下运行此代码,我的IDE代码样式为utf8。

任何人都可以帮助我吗?

2 个答案:

答案 0 :(得分:0)

        String gb2312 = new String(str.getBytes("utf-8"), "gb2312");

这个语句不正确,因为String构造函数应该采用匹配的字节数组和字符集,你说字节是utf-8但字符集是gb2312

答案 1 :(得分:0)

您正在寻找的是输出/输入时的编码/解码。

正如@kalpesh所说,在内部,它都是unicode。如果要读取特定编码的流,然后将其写入另一个,则必须指定字节(在流中)和字符串(在java中)之间转换的编码,然后在字符串之间(在java)到字节(输出流),如:

        InputStream is = new FileInputStream("utf8_encoded_text.txt");
        OutputStream os = new FileOutputStream("gb2312_encoded.txt");

        Reader r = new InputStreamReader(is,"utf-8");
        BufferedReader br = new BufferedReader(r);
        Writer w = new OutputStreamWriter(os, "gb2312");
        BufferedWriter bw = new BufferedWriter(w);

        String s=null;
        while((s=br.readLine())!=null) {
            bw.write(s);
        }
        br.close();
        bw.close();
        os.flush();

当然,您仍需要进行适当的异常处理,以确保所有内容都已正确关闭。