(代表雪花用户提交...)
我有8800万行的表格,并且在日期上应用了聚类 [具有28个不同的值],但是当我检查集群信息并 聚类深度,雪花将所有数据放在单个分区中, 聚类比为零。我关注了雪花文档 创建集群表并将数据插入表中。可以是什么 问题 ?我错过的任何步骤都不在文档中吗?我们要不要 需要在帐户级别启用群集?
最近的推荐:
对于早于自动聚类的客户,您必须手动 使用
alter table t1 resume recluster;
启用集群 只需通过设置群集密钥即可启用重新群集。首先,检查
AUTO_CLUSTERING_ON
中的列SHOW TABLES
;接下来,检查
AUTOMATIC_CLUSTERING_HISTORY()
下的结果;
还有其他建议或创新的“即用型”解决方案吗?谢谢!
答案 0 :(得分:1)
您可能需要要求您的帐户SE为您的帐户启用自动群集功能。尤其是如果您在集群历史记录视图中看不到任何动作。
select * from "SNOWFLAKE"."ACCOUNT_USAGE"."AUTOMATIC_CLUSTERING_HISTORY";
假设您具有ACCOUNTADMIN角色访问权限,则可以通过在“计费和使用情况”下的帐户中查找“ automatic_clustering”仓库来进行验证。如果您没有看到这个特殊的内部仓库,则可能是它没有打开。
如果您已经尝试恢复重新创建集群,但该集群仍处于关闭状态,则有可能不在帐户级别。
顺便提一句,88m行不足以进行集群,但是我想这取决于您的流失率或更新情况。您始终可以创建表as并自己对数据进行排序,以查看是否能更好地消除分区。
create table newtable as select * from oldtable order by date;
check the partition count with:
select system$clustering_information('tablename','(date)');