UTF-7表示中单个16位字符的最大大小(以字节为单位)

时间:2014-03-19 00:32:49

标签: unicode encoding utf-7

以UTF-7格式保存的单个UTF-16字符(2字节字符,即.NET中的char类型)的最大字节数是多少?

这是我在维基百科上发现的:

  

5表示一行单字节字符内的孤立情况。对于   每个字符运行2 2/3加上填充,使其成为一个整数   字节加上两个开始和结束运行

http://en.wikipedia.org/wiki/Comparison_of_Unicode_encodings#Seven-bit_environments

1 个答案:

答案 0 :(得分:2)

对于单个 UTF-16代码单元,您需要注意的唯一数字是 5

基本上,在UTF-7中,字符不在其“安全”字母表中 转换为UTF-16然后转换为modified Base64。使用单个UTF-16代码单元,将其转换为2个2/3 Base64单元,然后填充为完整3.在开头和可能结尾添加转义字符以将其表示为UTF-7序列,从而产生最多5个字节。