如何在UTF-8文件中从字符位置转换为字节位置?

时间:2013-02-08 23:22:13

标签: java utf-8 byte

我有UTF-8编码的文本文件。我可以通过字符来阅读它。每个字符可以是一个字节或多字节。我如何才能知道一个字节的确定位置,并且重新判断多于一个字节?

1 个答案:

答案 0 :(得分:0)

在读取char时计算字节数。

对于每个char c

if(c<128)
  bytesCount++;
else if (c<2048)
  bytesCount+=2;
else
  bytesCount+=3;

另请参阅编码定义wikipedia URF8