整理强度和当地语言关系

时间:2010-09-18 01:19:57

标签: localization internationalization collation

我从Collat​​or的Javadoc中读到了以下内容。

“语言特征的优势的确切分配取决于语言环境。例如,在捷克语中,”e“和”f“被认为是主要差异,而”e“和”ê“是次要差异,”e“和“E”是三级差异,“e”和“e”是相同的。“

这是否意味着我应该根据我使用的语言设置STRENGTH?如果是这样,有人可以建议区域设置的默认值:us_en,us_es,ca_fr,spain_spanish,chile_spanish,portuguese

1 个答案:

答案 0 :(得分:11)

真的取决于你想要做什么。对于使用拉丁字母的大多数(所有?)语言,情况如下:

    • 不同:a,á,Á,b
    • 相同:á,â
    • 相同:a,A
  • 二次
    • 不同:a,á,Á,b
    • 不同:á,â
    • 相同:a,A
  • 第三纪
    • 不同:a,á,Á,b
    • 不同:á,â
    • 不同:a,A
    • 还要考虑您看不到的差异,例如(accented A)(A) + (accent)
    • 之间的差异

语言之间会有细微差别,但实质上是:

  • 如果您想要区分大小写的比较,请使用Tertiary。
  • 对于不区分大小写的比较,请使用主要或辅助,具体取决于您是否要将á与â“组合在一起。
  • 一些整理规则很奇怪。 a即使在Primary中也不同于á,即使在Primary / Secondary中,á也不同于Á。我不知道为什么;可能是吗?
  • 谁知道非拉丁语言会发生什么。