将大型Excel文件导入SQL Server的最佳方法

时间:2015-06-21 23:22:05

标签: sql-server csv ssis pentaho bcp

我们正在尝试设计一种将非常大的Excel文件导入SQL数据库的最佳方法。使用SSIS有点麻烦,因为它扫描前X个记录以确定文件的格式,但是进一步向下的行可能会有所不同,因此需要大量的试验和错误,我们必须将不寻常的列放到顶部所以SSIS可以"学习"。

当我们获取要导入的新文件格式时,它们符合行格式化等规范 - 因此我们可以说我们事先了解了架构。 SQL目标表具有相同的模式,还有一些额外的列,例如插入日期和原始文件名。

是否有更简单的方法为我们要插入的新文件创建格式定义?我们不必使用SSIS,我们对任何其他工具持开放态度,并尽可能提高自动化程度。我们正在计划测试我们将要导入的数据的完整性,我们正在计划针对分段数据集进行基本查询,例如"不到1%的记录可能会错过邮政编码"等

非常感谢

1 个答案:

答案 0 :(得分:0)

也许您可以将数据导入为文本,之后您可以使用派生列转换将其转换。您可以使用连接字符串中的IMEX选项将Excel中的数据作为文本读取。有关此参数的详细信息,请参阅here