在Cassandra表中连续排序列时,我们似乎只限于四种不同的数据类型。我能看到的四种类型是:
BytesType,AsciiType,UTF8Type,IntegerType
但是,要使用给定语言正确排序,可以使用strcoll()
,它会使用区域设置,并根据语言在其他字符之前或之后对某些字符进行排序。
例如,在法语中,您对 e 字符进行了重音,其分类如下:
... deéêèëf......
我认为UTF8Type
不会让法语发言者按预期工作。
是唯一可以实现这一目标的方法,在Cassandra中实际实现我们自己的排序吗? (唉,我不喜欢Java ......)
答案 0 :(得分:0)
您始终可以将区域设置设置为常量,以便始终获得相同的结果。或者,您可以按Unicode编号对其进行排序,而不是Java的区域设置感知算法。