我需要在表中添加一个具有唯一整数/哈希值的列作为行ID。
我使用此查询创建了一个表DUPLICATES:
CREATE TABLE duplicates AS
SELECT
"a", "b", COUNT(*) as _count
FROM
"table"
GROUP BY
"a", "b"
HAVING
_count > 1
ORDER BY
_count desc
现在我需要添加一个包含每行唯一ID的列。我尝试ALTER TABLE DUPLICATES ADD 'id' int identity(1,1)
,但是这会返回: SQL编译错误:无法将具有非常量默认值的列'id'添加到非空表'DUPLICATES'。
我现在缺乏想法,因为关于Snowflake SQL的讨论尚未普及,Snowflake的帮助页面对我没有帮助。
答案 0 :(得分:3)
一种简单的方法是使用row_number()
:
CREATE TABLE duplicates AS
SELECT ROW_NUMBER() OVER (ORDER BY COUNT(*) DESC) as id,
"a", "b", COUNT(*) as _count
FROM "table"
GROUP BY "a", "b"
HAVING _count > 1
ORDER BY _count desc;
答案 1 :(得分:1)
在Snowflake中执行此操作的最简单方法是使用Sequences。非常简单,但它们可用于生成主键或任何需要唯一值的列的值。使用方法:
https://docs.snowflake.net/manuals/user-guide/querying-sequences.html