我正在使用带立陶宛语(lt_LT
)语言的ICU。该语言的字母表如下:a ą b c č d e ę ė <...> v z ž
但是,在排序时,ICU的整理程序会假设,例如a
和ą
(a
与ogonek)相同,因此立陶宛语单词列表的排序方式如下:
a, ą, ab, aba, abadas, <...>, b, ba, <...>`
当预期结果为:
a, ab, aba, abadas, <...>, ą, <...>, b, ba, <...>
其他“重音”字母(e
- ę
- ė
,z
- ž
等也是如此。
更具体的测试用例:如果不是source/samples/coll/coll -locale lt_LT -source ą -target aa
则运行source is less than target
(如果需要,请参阅coll.cpp。)
预计会出现这种情况吗?这是一个错误还是一个功能?如果是这样,我怎样才能阻止ICU的整理者将“相似”字母对齐?