Question

我正在尝试测试一组代码用于字符集解码（第三方库）。我写了一个像这样的输入字符串：

private static String czech = "Český";
private static String japanese = "日本語";
private static String german = "Entwickeln Sie mit Vergnügen";
private static  String china = "愉快地發展";

现在我试图从这个字符串中获取一个字节数组（byte []）。怎么做正确??例如，我试过

byte bb = japanese.getBytes(Charset.forName("EUC-JP")); 
// because EUC-JP
// EUC_JP JISX 0201, 0208 and 0212, EUC encoding Japanese 
// from [http://docs.oracle.com/javase/8/docs/technotes/guides/intl/encoding.doc.html][1]

但似乎不对，因为结果返回了默认的UTF-8。也许输入字符串太短或我使用了错误的编码名称？

*测试的工作原理如下：

  String encodingName = testerOfEncoding(bb); // default UTF-8 (if could not detect) =)

使用正确的编码将字符串转换为byte []

0 个答案: