我有一个Redshift COPY命令,该命令将价值一天的数据导入表中。我正在尝试创建数据表,但有一个“有效”主键-IE在表中应该没有重复的ID-但要保留与每个ID关联的数据。
当前我正在使用以下查询:
SELECT DISTINCT(a.uid),b.city FROM user_temp as a
INNER JOIN user_temp as b
ON a.uid = b.uid
但是,这将返回user_temp表中不止一次存在的人员的多个记录。我也尝试过:
SELECT DISTINCT * FROM user_temp
但是,全天这些ID都会随着它们变化而变化。我感兴趣的是每个ID仅包含一行,并与之关联一组数据。
当前导入的数据是这样传递的:
|UID | City |
|----|---------|
|1 | London|
|1 | York |
|2 | Derby |
|2 |Leicester|
在输出表中,每个UID和任何关联的城市都只有一个。