使用正确的编码将字符串转换为byte []

时间:2014-10-01 10:25:59

标签: java encoding

我正在尝试测试一组代码用于字符集解码(第三方库)。 我写了一个像这样的输入字符串:

private static String czech = "Český";
private static String japanese = "日本語";
private static String german = "Entwickeln Sie mit Vergnügen";
private static  String china = "愉快地發展";

现在我试图从这个字符串中获取一个字节数组(byte [])。 怎么做正确??例如,我试过

byte bb = japanese.getBytes(Charset.forName("EUC-JP")); 
// because EUC-JP
// EUC_JP JISX 0201, 0208 and 0212, EUC encoding Japanese 
// from [http://docs.oracle.com/javase/8/docs/technotes/guides/intl/encoding.doc.html][1]

但似乎不对,因为结果返回了默认的UTF-8。 也许输入字符串太短或我使用了错误的编码名称?

*测试的工作原理如下:

  String encodingName = testerOfEncoding(bb); // default UTF-8 (if could not detect) =)

0 个答案:

没有答案