标签: java utf-8 byte
我有UTF-8编码的文本文件。我可以通过字符来阅读它。每个字符可以是一个字节或多字节。我如何才能知道一个字节的确定位置,并且重新判断多于一个字节?
答案 0 :(得分:0)
在读取char时计算字节数。
char
对于每个char c:
char c
if(c<128) bytesCount++; else if (c<2048) bytesCount+=2; else bytesCount+=3;
另请参阅编码定义wikipedia URF8