雪花无法聚簇表

时间:2019-10-15 22:44:44

标签: snowflake-data-warehouse

(代表雪花用户提交...)


  

我有8800万行的表格,并且在日期上应用了聚类   [具有28个不同的值],但是当我检查集群信息并   聚类深度,雪花将所有数据放在单个分区中,   聚类比为零。我关注了雪花文档   创建集群表并将数据插入表中。可以是什么   问题 ?我错过的任何步骤都不在文档中吗?我们要不要   需要在帐户级别启用群集?


最近的推荐:

  

对于早于自动聚类的客户,您必须手动   使用alter table t1 resume recluster;启用集群   只需通过设置群集密钥即可启用重新群集。

     

首先,检查AUTO_CLUSTERING_ON中的列SHOW TABLES

     

接下来,检查AUTOMATIC_CLUSTERING_HISTORY()下的结果;


还有其他建议或创新的“即用型”解决方案吗?谢谢!

1 个答案:

答案 0 :(得分:1)

您可能需要要求您的帐户SE为您的帐户启用自动群集功能。尤其是如果您在集群历史记录视图中看不到任何动作。

select * from  "SNOWFLAKE"."ACCOUNT_USAGE"."AUTOMATIC_CLUSTERING_HISTORY";

假设您具有ACCOUNTADMIN角色访问权限,则可以通过在“计费和使用情况”下的帐户中查找“ automatic_clustering”仓库来进行验证。如果您没有看到这个特殊的内部仓库,则可能是它没有打开。

AUTOMATIC_CLUSTERING

如果您已经尝试恢复重新创建集群,但该集群仍处于关闭状态,则有可能不在帐户级别。

顺便提一句,88m行不足以进行集群,但是我想这取决于您的流失率或更新情况。您始终可以创建表as并自己对数据进行排序,以查看是否能更好地消除分区。

Create Table with new order

create table newtable as select * from oldtable order by date;

check the partition count with

select system$clustering_information('tablename','(date)');