雪花,获取两个表之间不匹配列的列表(SQL)

时间:2017-10-10 09:09:54

标签: sql snowflake-datawarehouse

我一直在做一些研究,但没有找到太多。我需要比较两个表来获取表1中列的列表,但不是表2中的列。我使用的是Snowflake。 现在,我找到了这个答案:postgresql - get a list of columns difference between 2 tables

问题是当我运行代码时出现此错误:

SQL compilation error: invalid identifier TRANSIENT_STAGE_TABLE

如果我单独运行代码,代码可以正常工作,所以如果我运行:

SELECT column_name
FROM information_schema.columns 
WHERE table_schema = 'your_schema' AND table_name = 'table2'

我实际上得到了一个列名列表,但是当我将它链接到第二个表达式时,会返回上面的错误。 对于发生了什么的暗示? 谢谢

1 个答案:

答案 0 :(得分:1)

来自原始帖子的查询应该有效,也许您在某个地方缺少单引号?见这个例子

create or replace table xxx1(i int, j int);
create or replace table xxx2(i int, k int);

-- Query from the original post
SELECT column_name
FROM information_schema.columns 
WHERE table_name = 'XXX1'
    AND column_name NOT IN
    (
        SELECT column_name
        FROM information_schema.columns 
        WHERE table_name = 'XXX2'
    );
-------------+
 COLUMN_NAME |
-------------+
 J           |
-------------+

您还可以编写一个稍微复杂一点的查询,以查看两个表中不匹配的所有列:

with 
s1 as (
  select table_name, column_name 
  from information_schema.columns 
  where table_name = 'XXX1'), 
s2 as (
  select table_name, column_name 
  from information_schema.columns 
  where table_name = 'XXX2') 
select * from s1 full outer join s2 on s1.column_name = s2.column_name;
------------+-------------+------------+-------------+
 TABLE_NAME | COLUMN_NAME | TABLE_NAME | COLUMN_NAME |
------------+-------------+------------+-------------+
 XXX1       | I           | XXX2       | I           |
 XXX1       | J           | [NULL]     | [NULL]      |
 [NULL]     | [NULL]      | XXX2       | K           |
------------+-------------+------------+-------------+

您可以添加WHERE s1.column_name IS NULL or s2.column_name IS NULL来查找当然只缺少的列。

您还可以轻松扩展它以检测列类型差异。