ASCII与UTF-8?

时间:2018-12-09 18:22:54

标签: python encoding

假设存储大小很重要: 我有一长串要写入文件的数字(0-9)。从存储的角度来看,使用ASCII或UTF-8作为编码会更有效吗? 是否可以使用其他方法创建较小的文件?

2 个答案:

答案 0 :(得分:4)

存储数字时,ASCII和UTF-8之间没有区别。更紧密的包装将使用每位4位(BCD)。

如果要低于此值,则需要利用以下事实:10进制值的长序列可以表示为2进制(二进制)值。

答案 1 :(得分:3)

在这种情况下绝对没有区别;在此字符范围内,UTF-8与ASCII相同。

如果存储是一个重要的考虑因素,则可以考虑压缩。简单的霍夫曼压缩将为此类数据使用每字节3位的内容。如果存在周期性模式,则现代的压缩算法可以更进一步。