是否有区域分辨率的标准算法?

时间:2011-12-27 17:48:14

标签: language-agnostic localization standards locale rfc

为了支持软件国际化,许多编程语言和平台支持获取在向用户显示的UI中使用的本地化资源的方法(例如Java的java.util.ResourceBundle类)。通常,如果用户首选语言环境的资源不可用,则会有一个回退机制或区域设置解析过程,它将尝试从可用资源集中查找最近匹配的资源。例如,如果en-US的资源不可用,则系统通常会尝试查找en的资源。

对于许多语言和平台的资源包解决方案,区域设置解析过程似乎几乎相同。他们是否遵循一些标准的区域设置解析算法,或者,如果没有,是否存在这样的标准?

3 个答案:

答案 0 :(得分:2)

显然有RFC 4647,匹配语言标签,它描述了用于指定用户首选语言列表的“语言范围”的语法,以及“过滤”和“查找”机制。将语言范围与RFC 4646语言标记进行比较和匹配。 RFC 4647将这些机制描述为:

  

过滤产生一组(可能为空)语言标签,而查找产生单一语言标签。

答案 1 :(得分:1)

我本身并不知道标准。

然而,正在使用的算法是区域设置是分层的这一事实的微不足道的结果。有一个(名义上的)根区域设置没有名称。在这下面是仅限语言的语言环境(en,fr等)。其下是国家语言环境(en_GB,en_US等)。在这些之下,可选地,变体区域设置(en_GB_Yorkshire,en_GB_cockney等 - 对于现实示例,请查看挪威)。

找到合适资源的自然方法是从最低,最具体的区域设置开始,然后沿树向上走,直到找到一些东西。所以,从en_US_TX开始,你升级到en_US,然后是en,然后是根。

答案 2 :(得分:1)

CLDR - Unicode Common Locale Data Repository基于language distance提出了(截至2015年)算法。如果没有距离数据,这不是解决方案,但值得关注未来的解决方案。