我创建了一个UTF-8编码的文件,但我不了解磁盘占用大小的规则。这是我的完整研究:
首先,我创建了一个印地语字母'क'并且Windows 7上的文件大小为
8个字节。
现在有两个字母'कक'文件大小为11个字节。
现在有三个字母'ककक'文件大小为14个字节。
有人可以解释一下为什么显示这样的尺寸吗?
答案 0 :(得分:7)
前三个字节用于BOM (Byte Order Mark) EF BB BF
。
然后,字节E0 A4 95
编码字母क。
然后字节0D 0A
编码一个回车符。
总计:8个字节。对于您添加的每个字母,您需要三个字节。
答案 1 :(得分:0)