UTF-8和en_AU.UTF-8之间的区别

时间:2015-04-20 14:50:16

标签: utf-8

我有一些UTF-8中的文本,它在文本编辑器中仍然显示出奇怪(文本编辑器具有UTF-8编码集)。我知道例如ISO8859-2是与ascii兼容的一个字节编码,具有特定于领土的高128值,因此来自该地域的ppl仍然可以使用一个字节编码来显示不属于ascii且不具有的字符需要使用像UTF-8这样的多字节编码。 en_AU.UTF-8的en_AU部分的目的是什么?难道不知道为什么即使它是UTF-8,我仍然看到我的文字搞砸了?我的意思是当使用en_AU时,某些值应该映射到不同的字符?据我所知,UTF-8是不可能的,但这是文本混乱的最后一点。

从linux上的locale命令输出

LANG=en_US.UTF-8
LANGUAGE=en
LC_CTYPE="en_US.UTF-8"
LC_NUMERIC=cs_CZ.UTF-8
LC_TIME=cs_CZ.UTF-8
LC_COLLATE="en_US.UTF-8"
LC_MONETARY=cs_CZ.UTF-8
LC_MESSAGES="en_US.UTF-8"
LC_PAPER=cs_CZ.UTF-8
LC_NAME=cs_CZ.UTF-8
LC_ADDRESS=cs_CZ.UTF-8
LC_TELEPHONE=cs_CZ.UTF-8
LC_MEASUREMENT=cs_CZ.UTF-8
LC_IDENTIFICATION=cs_CZ.UTF-8
LC_ALL=

1 个答案:

答案 0 :(得分:2)

在UNIX系统中,语言环境是磁盘上的文件,它们以特定的编码进行编码。因此,您可能在不同的编码中使用相同的区域设置,例如en_AU.iso55891en_AU.UTF-8。这不是UTF-8的某些变体,而是它是此特定语言环境文件的变体。如果您的语言环境使用语言环境的UTF-8变体,那么使用语言环境系统的任何内容都将输出UTF-8编码值。