Java如何处理UTF-16中不可编码的字符?

时间:2012-11-19 20:13:30

标签: java unicode character-encoding

由于Java在UTF-16内部保存字符,如果您需要以包含完全不是unicode的字符的特定编码输出该怎么办?

1 个答案:

答案 0 :(得分:1)

Java基本上只能处理Unicode中存在的字符。 BMP之外的文本(即U + FFFF以上)被编码为代理对(因为每个char是UTF-16代码单元)...但是如果你想要的字符根本不是Unicode,那么你“你自己 - 你可能会找到一些专用的Unicode区域,并在那里映射字符......但你可能会以各种奇怪的方式”玩得开心“。

肯定需要处理不是Unicode的字符吗?我认为这几天几乎涵盖了一切......