将XML文档插入SQL Server 2008数据库

时间:2012-02-28 18:05:28

标签: sql sql-server xml

我需要帮助将xml文件插入SQL Server 2008。

我有以下SQL语句:

insert into dbo.articles(id, title, contents)
  SELECT  X.article.query('id').value('.', 'INT'),
        X.article.query('article').value('.', 'VARCHAR(50)'),
        X.article.query('/doc/text()').value('.', 'VARCHAR(MAX)')
   FROM (
     SELECT CAST(x AS XML)
     FROM OPENROWSET(
           BULK 'E:\test\test_files\1000006.xml',
           SINGLE_BLOB) AS T(x)
        ) AS T(x)
CROSS APPLY x.nodes('doc') AS X(article);

基本上将XML文档粉碎成列。但是,我希望能够在文件夹中插入所有文件,而不是手动指定文件,如本例中的E:\ test \ test_files \ 1000006.xml

3 个答案:

答案 0 :(得分:1)

好的,先回答一下在stackoverflow中回答问题......

您有两个问题: - 首先将文件夹中的文件名转换为SQL表或表变量,然后从每个文件中读取XML。

如果您不介意使用xp_cmdshell

,首先很容易
DECLARE @Folder         VARCHAR(255)    = 'C:\temp\*.xml'
DECLARE @Command        VARCHAR(255)
DECLARE @FilesInAFolder TABLE  (XMLFileName VARCHAR(500))

--
SET @Command = 'DIR ' + @Folder + ' /TC /b'
--
INSERT INTO @FilesInAFolder
EXEC MASTER..xp_cmdshell @Command
--
SELECT * FROM @FilesInAFolder
WHERE XMLFileName IS NOT NULL

第二部分,将XML文件转换为SQL行有点棘手,因为BULK INSERT不会接受参数,也不能将BULK INSERT转换为XML表类型。这里的代码适用于一个文件...

DECLARE @x              xml
DECLARE @Results        TABLE  (result xml)
DECLARE @xmlFileName    NVARCHAR(300) = 'C:\temp\YourXMLFile.xml'
DECLARE @TempTable      TABLE 
    (
    ID                  INT,        
    Article             NVARCHAR(50),
    doctext             NVARCHAR(MAX)
    )   

/* ---- HAVE TO USE DYNAMIC sql BECAUSE BULK INSERT WON'T TAKE A PARAMETER---------*/
DECLARE @sql NVARCHAR(4000) =
 'SELECT * FROM OPENROWSET ( BULK ''' + @xmlFileName + ''', SINGLE_BLOB )AS xmlData'

/* ---- have to use a normal table variable because we can't directly bulk insert
        into an XML type table variable  ------------------------------------------*/
INSERT INTO @results EXEC(@SQL)

SELECT @x = result FROM @Results

/* ---- this is MUCH faster than using a cross-apply ------------------------------*/
INSERT INTO @TempTable(ID,Article,doctext)                                              
SELECT 
                x.value('ID[1]',        'INT'           ),      
                x.value('Article[1]',   'NVARCHAR(50)'  ),                      
                x.value('doctext[1]',   'NVARCHAR(MAX)' )   
FROM @x.nodes(N'/doc')      t(x) 

SELECT * FROM @TempTable

现在很难将这两者放在一起。我尝试了几种方法将此代码转换为函数,但是您无法在函数中使用动态SQL或EXEC,并且无法从函数调用SP而您无法将代码放入两个单独的SP中,因为您可以没有级联的EXEC语句,即您尝试使用上面的代码执行并执行SP,其中也包含EXEC,因此......您必须使用游标将两个代码块放在一起,即光标通过@FilesInAFolder将每个XMLFileName值作为变量@XMLFileName传递到第二个代码块中,或者使用SSIS或CLR。

抱歉,我没时间用一个目录名作为参数和游标来构建一个完整的SP,但这非常简单。呼!

答案 1 :(得分:0)

您使用的是存储过程吗?您可以将文件名指定为参数。

像...一样的东西。

CREATE PROCEDURE sp_XMLLoad
   @FileName
AS SET NOCOUNT ON
SELECT  X.article.query('id').value('.', 'INT'),
        X.article.query('article').value('.', 'VARCHAR(50)'),   
        X.article.query('/doc/text()').value('.', 'VARCHAR(MAX)')
FROM (
      SELECT CAST(x AS XML)
      FROM OPENROWSET(
            BULK @FileName,
            SINGLE_BLOB) AS T(x)

不完全那样......你需要在我打赌的@Filename周围添加引号。也许用引号组装它然后使用那个变量。

如果您正在使用SSIS,则可以将目录中的所有文件泵送到存储过程或所使用的SSIS代码。

答案 2 :(得分:0)

我认为你可以使用游标和xp_cmdshell来完成它。我不建议使用xp_cmdshell。

DECLARE @FilesInAFolder TABLE  (FileNames VARCHAR(500))
DECLARE @File VARCHAR(500)
INSERT INTO @FilesInAFolder
EXEC MASTER..xp_cmdshell 'dir /b c:\'


DECLARE CU CURSOR FOR 
SELECT 'c:\' + FileNames
FROM @FilesInAFolder
WHERE RIGHT(FileNames,4) = '.xml'

OPEN CU
FETCH NEXT FROM CU INTO @File
WHILE @@FETCH_STATUS = 0
BEGIN
    INSERT INTO dbo.articles(id, title, contents)
    SELECT  X.article.query('id').value('.', 'INT'),
            X.article.query('article').value('.', 'VARCHAR(50)'),
            X.article.query('/doc/text()').value('.', 'VARCHAR(MAX)')
    FROM (
            SELECT CAST(x AS XML)
            FROM OPENROWSET(
                    BULK @File,
                    SINGLE_BLOB) AS T(x)
         ) AS T(x)
    CROSS APPLY x.nodes('doc') AS X(article);

    FETCH NEXT FROM CU INTO @File
END

CLOSE CU
DEALLOCATE CU