我有以下表格:
DataValue
DateStamp ItemId Value
---------- ------ -----
2012-05-22 1 6541
2012-05-22 2 12321
2012-05-21 3 32
tmp_holding_DataValue
DateStamp ItemId Value
---------- ------ -----
2012-05-22 1 6541
2012-05-22 4 87
2012-05-21 5 234
DateStamp
和ItemId
是主要的关键列。
我正在进行一整天定期运行的插入(在存储过程中):
insert into DataValue(DateStamp, ItemId, Value)
select DateStamp, ItemId, Value from tmp_holding_DataValue;
这会将保留表(tmp_holding_DataValue
)中的数据移动到主数据表(DataValue
)中。然后截断保留表。
问题在于,如示例中所示,保留表可以包含主表中已存在的项。由于密钥不允许重复值,因此过程将失败。
一个选项是在insert proc上放置一个where子句,但主数据表有1000万行,这可能需要很长时间。
还有其他方法让程序在尝试插入时跳过/忽略重复项吗?
答案 0 :(得分:27)
INSERT dbo.DataValue(DateStamp, ItemId, Value)
SELECT DateStamp, ItemId, Value
FROM dbo.tmp_holding_DataValue AS t
WHERE NOT EXISTS (SELECT 1 FROM dbo.DataValue AS d
WHERE DateStamp = t.DateStamp
AND ItemId = t.ItemId);
答案 1 :(得分:19)
您可以将PK指定为忽略重复键=是。然后它只会给出一个警告重复键被忽略并继续。我不猜。我测试了这个。
我发现我不能这样做是SMSS。必须通过脚本删除并重新创建索引。但是您可以右键单击索引,选择drop并重新创建,然后只需更改Ignore Duplicate Key = Yes。对我来说,SMSS没有立即显示变化。
IF EXISTS (SELECT * FROM sys.indexes WHERE object_id = OBJECT_ID(N'[dbo].[PKallowDup]') AND name = N'PK_PKallowDup')
ALTER TABLE [dbo].[PKallowDup] DROP CONSTRAINT [PK_PKallowDup]
GO
USE [test]
GO
/****** Object: Index [PK_PKallowDup] Script Date: 05/22/2012 10:23:13 ******/
ALTER TABLE [dbo].[PKallowDup] ADD CONSTRAINT [PK_PKallowDup] PRIMARY KEY CLUSTERED
(
[PK] ASC
)WITH (PAD_INDEX = OFF, STATISTICS_NORECOMPUTE = OFF, SORT_IN_TEMPDB = ON, IGNORE_DUP_KEY = ON, ONLINE = OFF, ALLOW_ROW_LOCKS = ON, ALLOW_PAGE_LOCKS = ON) ON [PRIMARY]
GO
或者我认为你可以使用外连接
INSERT dbo.DataValue(DateStamp, ItemId, Value)
SELECT t.DateStamp, t.ItemId, t.Value
FROM dbo.tmp_holding_DataValue AS t
left join dbo.DataValue AS d
on d.DateStamp = t.DateStamp
AND d.ItemId = t.ItemId
WHERE d.DateStamp is null
and d.ItemId in null
答案 2 :(得分:18)
在SQL Server 2008+
:
MERGE
INTO dataValue dv
USING tmp_holding_DataValue t
ON t.dateStamp = dv.dateStamp
AND t.itemId = dv.itemId
WHEN NOT MATCHED THEN
INSERT (dateStamp, itemId, value)
VALUES (dateStamp, itemId, value)
/*
WHEN MATCHED THEN
UPDATE
value = t.value
*/
-- Uncomment above to rewrite duplicates rather than ignore them
答案 3 :(得分:1)
我遇到了类似的要求,最终导致了相同的重复键错误,然后想法选择多个不同的列(主要),同时返回其他列check:
INSERT INTO DataValue(DateStamp, ItemId, Value)
SELECT DISTINCT DateStamp, ItemId, MAX(Value) AS Value
FROM tmp_holding_DataValue
GROUP BY DateStamp, ItemId
事实上,目标可以在没有Distinct的情况下完成,因为聚合函数MAX将选择单个值。