我有一张大约有200k地址的表。有些是不活跃的,其他人是活跃不活跃的是我活跃的重复。一些活动的没有address_3(社区名称),但一些非活动的重复项确实有address_3。我需要成为活动的重复匹配中的非活动address_3。我正在努力解决这个问题。有人可以帮忙吗?
答案 0 :(得分:1)
假设有一个名为address_1的字段或我们可以分组的字段,我会:
•创建一个空表(通过重用现有表中的DDL) •使用address_3 IS NOT NULL的行填充该表,并确保GROUP BY相应的列(示例如下所示)。
我会在没有INSERT的情况下运行SELECT,以确保您拥有正确的数据。
INSERT INTO second_addresses_table
SELECT
a.address_1,
-- #other columns...
a.address_3,
TRUE -- #default to Active = TRUE
FROM
first_addresses_table a
WHERE
a.address_3 IS NOT NULL
GROUP BY
a.address_1,
-- #other columns...
a.address_3