在Snowflake SQL中向表中添加行ID

时间:2018-04-24 20:36:36

标签: sql snowflake-datawarehouse snowflake-schema snowflake

我需要在表中添加一个具有唯一整数/哈希值的列作为行ID。

我使用此查询创建了一个表DUPLICATES:

CREATE TABLE duplicates AS SELECT "a", "b", COUNT(*) as _count FROM "table" GROUP BY "a", "b" HAVING _count > 1 ORDER BY _count desc

现在我需要添加一个包含每行唯一ID的列。我尝试ALTER TABLE DUPLICATES ADD 'id' int identity(1,1),但是这会返回: SQL编译错误:无法将具有非常量默认值的列'id'添加到非空表'DUPLICATES'

我现在缺乏想法,因为关于Snowflake SQL的讨论尚未普及,Snowflake的帮助页面对我没有帮助。

2 个答案:

答案 0 :(得分:3)

一种简单的方法是使用row_number()

CREATE TABLE duplicates AS
    SELECT ROW_NUMBER() OVER (ORDER BY COUNT(*) DESC) as id,
           "a", "b", COUNT(*) as _count
    FROM "table"
    GROUP BY "a", "b"
    HAVING  _count > 1
    ORDER BY _count desc;

答案 1 :(得分:1)

在Snowflake中执行此操作的最简单方法是使用Sequences。非常简单,但它们可用于生成主键或任何需要唯一值的列的值。使用方法:

https://docs.snowflake.net/manuals/user-guide/querying-sequences.html