我正在尝试测试一组代码用于字符集解码(第三方库)。 我写了一个像这样的输入字符串:
private static String czech = "Český";
private static String japanese = "日本語";
private static String german = "Entwickeln Sie mit Vergnügen";
private static String china = "愉快地發展";
现在我试图从这个字符串中获取一个字节数组(byte [])。 怎么做正确??例如,我试过
byte bb = japanese.getBytes(Charset.forName("EUC-JP"));
// because EUC-JP
// EUC_JP JISX 0201, 0208 and 0212, EUC encoding Japanese
// from [http://docs.oracle.com/javase/8/docs/technotes/guides/intl/encoding.doc.html][1]
但似乎不对,因为结果返回了默认的UTF-8。 也许输入字符串太短或我使用了错误的编码名称?
*测试的工作原理如下:
String encodingName = testerOfEncoding(bb); // default UTF-8 (if could not detect) =)