与下面提到的其他问题类似,我有两个表格结构:
create table parent (
recno int identity(1,1) primary key not null,
groupCode int,
parentdata varchar(80)
);
create table child (
parentrecno int not null,
childdata varchar(80)
)
我需要在这些表中快速插入几十万个记录 - 这些表包含数百万个与此插入无关的其他记录,并且永远不会安静。由于父/子的性质,SqlBulkCopy
不是一个好的候选人(似乎)。
在使用SqlCommand
和INSERT
的C#中我插入了大约400-500条记录/秒,这有点太慢了。伪代码:
foreach(Record r in parentRecords)
{
Insert Fields from r into SqlCommand Parameters but not "recno"
Call ExecuteScalar to insert and fetch the inserted identity value (recno)
foreach(ChildRecord cr in parentRecords.Children)
{
Insert Fields from cr into SqlCommand Parameters
Insert the identity value (recno) from above into Parameters
(as parentrecno)
Call ExecuteNonQuery to insert the record
}
}
在阅读其他帖子之后,我发现了一个。附加到父记录的groupCode
对于我插入的那组父记录是唯一的。它会起作用吗?
SqlBulkCopy
批量插入父记录,让插件照常自动生成recno
标识字段。仅对插入的记录执行SELECT
:
select recno from parent where groupCode = @thisgroup order by recno;
使用检索到的值填写内存中子记录的parentrecno
字段
SqlBulkCopy
这将依赖于进入SQL表的父记录,其顺序与原始DataTable中的顺序相同(并且标识值以相同的顺序分配)。 这是我可以信赖的吗?
相关问题:
How to update Dataset Parent & Child tables with Autogenerated Identity Key?
SqlBulkCopy and DataTables with Parent/Child Relation on Identity Column
答案 0 :(得分:6)
创建两个与目标表具有相同结构的临时表,但不要在recno列上使用标识。
create table parentTmp (
recno int,
groupCode int,
parentdata varchar(80)
);
create table childTmp (
parentrecno int not null,
childdata varchar(80)
)
将数据批量加载到临时表,保持recno / parentrecno值不变。
然后,您可以使用merge和output从登台表中移动数据。
-- Table variable to hold mapping between
-- SourceRecno and TargetRecno
declare @recno table(SourceRecno int, TargetRecno int);
-- Merge data from parentTmp to parent
-- Output old and new recno to @recno
merge parent T
using parentTmp S
on 0=1
when not matched then
insert (groupCode, parentdata)
values (S.groupCode, S.parentData)
output S.recno, inserted.recno into @recno;
-- Copy data from childTmp to child
-- Use @recno to get the new recno
insert into child(parentrecno, childdata)
select R.TargetRecno, C.childdata
from childTmp as C
inner join @recno as R
on C.parentrecno = R.SourceRecno;
这只适用于SQL Server 2008(后来我推测)。
答案 1 :(得分:1)
这不是一个绝对的批量插入,而是它与父数据同时插入所有子数据,只对数据库进行一次往返。
insert into parent(groupcode, parentdata) values(1, 'parent data');
insert into child(parentrecno, childdata) select parentrecno, childdata from (
select SCOPE_IDENTITY() as parentrecno, 'child data 1' as childdata
union
select SCOPE_IDENTITY() as parentrecno, 'child data 2' as childdata
union
select SCOPE_IDENTITY() as parentrecno, 'child data 3' as childdata
) childrendata;
您可以在C#代码中构建这样的脚本,然后为每个父级执行一个请求。
请注意,如果已知子数据量很大,这可能不是一个好方法。不知道细节,但我确信sql脚本的大小不能无限增长。