在从MySQL迁移到Citus群集期间,我使用了connection = (HttpURLConnection)myurl.openConnection();
分发方法。迁移已完成,但现在我想将分发方法更改为range
。
对于已包含数据的现有表格,是否可以将分配方法从hash
更改为range
?
我提出了以下程序,但我不确定它是否有效:
hash
表的minvalue
和maxvalue
列pg_dist_shard
表的分片存储类型列从pg_dist_partition
更新为r
h
答案 0 :(得分:4)
这是一个很好的问题。目前,Citus没有提供更改现有数据分区类型的直接方法。
在范围分区中,记录根据分区列值和分片最小/最大值放在分片中。如果记录x位于分片y中,则表示y.minvalue <= x.partition_column <= y.maxvalue
。
在散列分区中,对分区列进行散列处理,并根据此散列值路由记录。因此,您在pg_dist_shard
中看到的最小/最大值是散列函数结果的边界值。在这种情况下y.minvalue <= hash(x.partition_column) <= y.maxvalue
。
因此,执行您提到的更改最终会导致错误的分发。为了从范围分区切换到散列分区,应该重新分配数据。为此,我建议将数据重新加载到空的散列分区表中。
有关详细信息,请参阅Citus文档的Working with Distributed Tables和Hash Distribution部分。