应用错误收集

Cassandra可以为特定的人类语言排序列吗？

时间：2015-10-18 04:14:36

标签： sorting cassandra human-language

在Cassandra表中连续排序列时，我们似乎只限于四种不同的数据类型。我能看到的四种类型是：

BytesType，AsciiType，UTF8Type，IntegerType

但是，要使用给定语言正确排序，可以使用strcoll()，它会使用区域设置，并根据语言在其他字符之前或之后对某些字符进行排序。

例如，在法语中，您对 e 字符进行了重音，其分类如下：

... deéêèëf......

我认为UTF8Type不会让法语发言者按预期工作。

是唯一可以实现这一目标的方法，在Cassandra中实际实现我们自己的排序吗？（唉，我不喜欢Java ......）

1 个答案:

答案 0 :(得分：0)

您始终可以将区域设置设置为常量，以便始终获得相同的结果。或者，您可以按Unicode编号对其进行排序，而不是Java的区域设置感知算法。