您好我正在开发一个项目,我们需要每天处理几个xml文件,并使用这些文件中包含的信息填充数据库。
每个文件大约1Mb,包含大约1000条记录;我们通常需要处理12到25个这些文件。我已经看到了一些关于使用NHibernate的批量插入的信息,但是我们的问题在某种程度上比较棘手,因为xml文件包含与更新记录混合的新记录。
在xml中有一个标志,告诉我们特定记录是新记录还是对现有记录的更新,但不是更改了哪些信息。 xml记录不包含我们的数据库标识符,但我们可以使用xml记录中的标识符来唯一地定位数据库中的记录。
到目前为止,我们的策略是确定当前记录是插入还是更新,并且基于我们在数据库上执行插入或我们进行搜索,然后我们使用信息更新对象的信息来自xml记录,最后我们对数据库进行了更新。
我们当前的方法存在的问题是我们遇到了DB锁的问题,而且我们的性能下降得非常快。我们已经考虑过一些替代方案,比如为不同的操作设置单独的表,或者甚至是单独的数据库,但是做出这样的举动意味着要做出很大的努力,所以在我想要就这个问题提出社群意见之前,我需要提前做好准备。 / p>
答案 0 :(得分:17)
一些想法:
答案 1 :(得分:2)