UTF-8与ASCII文本

时间:2010-05-04 14:42:56

标签: sql

为什么sql数据库使用UTF-8编码?他们都使用8位存储角色吗?

3 个答案:

答案 0 :(得分:8)

UTF-8用于支持大量字符。在UTF-8中,最多4个字节可用于表示单个字符。

乔尔写了一篇关于这个主题的文章,你可能想参考

The Absolute Minimum Every Software Developer Absolutely, Positively Must Know About Unicode and Character Sets (No Excuses!)

答案 1 :(得分:1)

对于“普通”字符,仅使用8位。对于不适合8位的字符,可以使用更多位。这使得UTF-8是一种可变长度编码。

Wikipedia有一篇关于UTF-8的好文章。

ASCII仅定义128个字符。所以只有7位。但通常以8位/字符存储。 RS232(旧串行通信)可以使用7位字节。

答案 2 :(得分:0)

ASCII一次只能表示有限数量的字符。表示不基于拉丁字符集的任何语言都不是很有用。但是,作为UCS-4(Unicode)编码标准的UTF-8几乎可以代表任何语言。它通过将多个字节链接在一起来表示一个字符(或者字形更正确)来实现这一点。