澄清我的问题的一个例子:
香港人的母语是广东话,但我们都用不同的语言写作:Madarin Chinese。两种语言有点类似,而且香港人接受教育用Madarin中文写作。
广东话没有书写系统。尽管我们仍然对Madarin作为我们的写作语言感到满意,但是,如果有一天香港人决定开发一个包含尚未存在的字符的“粤语脚本”,那么UTF8 / Unicode /字体应该如何改变以适应这些新字符?
我的意思是,谁将更改UTF8 / Unicode /字体标准?如何修改Linux / Windows操作系统,以显示这些新创建的字符?
(这个例子只是为了让我的问题清楚。我们不是在讨论政治问题; D)
答案 0 :(得分:0)
Unicode委员会在他们认为合适时添加新角色。然后字体添加对新字符的支持。操作系统不应仅仅为了显示新字符而需要更改。键入字符通常需要对操作系统的输入方法进行更新或插件。
答案 1 :(得分:0)
Unicode编码空间有超过1,000,000个代码点,并且只分配了大约10%的代码点,因此新字符有很大空间(即使编码空间的某些区域已被分开使用其他区域)比添加的字符)。 Unicode联盟与ISO的相关机构密切合作,根据提供实际使用的提案或在某些情况下具有坚实基础和广泛支持的计划,为新角色分配代码点。
因此,如果设计了一个新脚本并且有一个大型社区会认真使用它,那么在经过适当的提议和讨论之后,它将以其字符添加到Unicode中。
然后由字体制造商为这些字符添加字形。这可能需要很长时间,但如果有足够强烈的需求,将出现新字体和现有字体的增强功能。
不需要更改UTF-8或其他Unicode传输编码。它们已经编码了整个编码空间,无论代码点是否分配给字符。
渲染软件不需要修改,除非在书写系统中有一些专业。只要有合适的字体,普通字符就会很好地呈现。
但是,如果添加的字符超出了基本多语言平面(BMP),那么“16位Unicode的子集”,渲染和处理(以及输入)都会出现问题。许多编程语言和程序有效地将Unicode视为16位代码,并在使用BMP之外的字符时遇到问题(可能是可解决的,但仍然可以解决)。如果写作系统有10,000个字符,则很可能必须在BMP之外进行分配。