我目前正在开发一个受益于本地化语言环境代码的项目。例如,RFC 5646和父标准BCP 47定义了各种语言环境的语言环境代码,例如英国英语的en-GB和使用简体中文字符的新加坡汉语的zh-Hans-SG。不幸的是,这些代码仅使用拉丁字母的一小部分。
我正在寻找一种类似的标准或常用系统,它在每种语言的相应书写系统中定义一组语言代码(有点类似于自动语言)。
编辑:我正在严格寻找本地化的语言环境代码,因为在问题的上下文(URI i18n / l10n)中,使用自动语言或其他详细的等效语言是不合理的。答案 0 :(得分:1)
RFC 5656和BCP 47指定的区域代码是机器可解析的。因此,en-GB是“英语(英国)”,zh-Hans-SG是“中文(新加坡,简体中文剧本)”。
它们的设计使网页,电子书和其他文档能够以标准方式指定它们所使用的语言和脚本。
因此,每个语言,脚本和国家/地区都会获得相应标准的唯一代码,并在IANA语言子标签注册表(http://www.iana.org/assignments/language-subtag-registry/language-subtag-registry)中进行整理。
对于本地化版本,最好将代码映射到本地化名称(例如,本地化子标签注册表数据库的Description字段,或使用iso代码之类的项目),并以可显示的方式格式化,将语言环境代码保留为内部表示。