Cassandra可以为特定的人类语言排序列吗?

时间:2015-10-18 04:14:36

标签: sorting cassandra human-language

在Cassandra表中连续排序列时,我们似乎只限于四种不同的数据类型。我能看到的四种类型是:

  

BytesType,AsciiType,UTF8Type,IntegerType

但是,要使用给定语言正确排序,可以使用strcoll(),它会使用区域设置,并根据语言在其他字符之前或之后对某些字符进行排序。

例如,在法语中,您对 e 字符进行了重音,其分类如下:

  

... deéêèëf......

我认为UTF8Type不会让法语发言者按预期工作。

是唯一可以实现这一目标的方法,在Cassandra中实际实现我们自己的排序吗? (唉,我不喜欢Java ......)

1 个答案:

答案 0 :(得分:0)

您始终可以将区域设置设置为常量,以便始终获得相同的结果。或者,您可以按Unicode编号对其进行排序,而不是Java的区域设置感知算法。