我需要帮助将xml文件插入SQL Server 2008。
我有以下SQL语句:
insert into dbo.articles(id, title, contents)
SELECT X.article.query('id').value('.', 'INT'),
X.article.query('article').value('.', 'VARCHAR(50)'),
X.article.query('/doc/text()').value('.', 'VARCHAR(MAX)')
FROM (
SELECT CAST(x AS XML)
FROM OPENROWSET(
BULK 'E:\test\test_files\1000006.xml',
SINGLE_BLOB) AS T(x)
) AS T(x)
CROSS APPLY x.nodes('doc') AS X(article);
基本上将XML文档粉碎成列。但是,我希望能够在文件夹中插入所有文件,而不是手动指定文件,如本例中的E:\ test \ test_files \ 1000006.xml
答案 0 :(得分:1)
好的,先回答一下在stackoverflow中回答问题......
您有两个问题: - 首先将文件夹中的文件名转换为SQL表或表变量,然后从每个文件中读取XML。
如果您不介意使用xp_cmdshell
,首先很容易DECLARE @Folder VARCHAR(255) = 'C:\temp\*.xml'
DECLARE @Command VARCHAR(255)
DECLARE @FilesInAFolder TABLE (XMLFileName VARCHAR(500))
--
SET @Command = 'DIR ' + @Folder + ' /TC /b'
--
INSERT INTO @FilesInAFolder
EXEC MASTER..xp_cmdshell @Command
--
SELECT * FROM @FilesInAFolder
WHERE XMLFileName IS NOT NULL
第二部分,将XML文件转换为SQL行有点棘手,因为BULK INSERT不会接受参数,也不能将BULK INSERT转换为XML表类型。这里的代码适用于一个文件...
DECLARE @x xml
DECLARE @Results TABLE (result xml)
DECLARE @xmlFileName NVARCHAR(300) = 'C:\temp\YourXMLFile.xml'
DECLARE @TempTable TABLE
(
ID INT,
Article NVARCHAR(50),
doctext NVARCHAR(MAX)
)
/* ---- HAVE TO USE DYNAMIC sql BECAUSE BULK INSERT WON'T TAKE A PARAMETER---------*/
DECLARE @sql NVARCHAR(4000) =
'SELECT * FROM OPENROWSET ( BULK ''' + @xmlFileName + ''', SINGLE_BLOB )AS xmlData'
/* ---- have to use a normal table variable because we can't directly bulk insert
into an XML type table variable ------------------------------------------*/
INSERT INTO @results EXEC(@SQL)
SELECT @x = result FROM @Results
/* ---- this is MUCH faster than using a cross-apply ------------------------------*/
INSERT INTO @TempTable(ID,Article,doctext)
SELECT
x.value('ID[1]', 'INT' ),
x.value('Article[1]', 'NVARCHAR(50)' ),
x.value('doctext[1]', 'NVARCHAR(MAX)' )
FROM @x.nodes(N'/doc') t(x)
SELECT * FROM @TempTable
现在很难将这两者放在一起。我尝试了几种方法将此代码转换为函数,但是您无法在函数中使用动态SQL或EXEC,并且无法从函数调用SP而您无法将代码放入两个单独的SP中,因为您可以没有级联的EXEC语句,即您尝试使用上面的代码执行并执行SP,其中也包含EXEC,因此......您必须使用游标将两个代码块放在一起,即光标通过@FilesInAFolder将每个XMLFileName值作为变量@XMLFileName传递到第二个代码块中,或者使用SSIS或CLR。
抱歉,我没时间用一个目录名作为参数和游标来构建一个完整的SP,但这非常简单。呼!
答案 1 :(得分:0)
您使用的是存储过程吗?您可以将文件名指定为参数。
像...一样的东西。
CREATE PROCEDURE sp_XMLLoad
@FileName
AS SET NOCOUNT ON
SELECT X.article.query('id').value('.', 'INT'),
X.article.query('article').value('.', 'VARCHAR(50)'),
X.article.query('/doc/text()').value('.', 'VARCHAR(MAX)')
FROM (
SELECT CAST(x AS XML)
FROM OPENROWSET(
BULK @FileName,
SINGLE_BLOB) AS T(x)
不完全那样......你需要在我打赌的@Filename周围添加引号。也许用引号组装它然后使用那个变量。
如果您正在使用SSIS,则可以将目录中的所有文件泵送到存储过程或所使用的SSIS代码。
答案 2 :(得分:0)
我认为你可以使用游标和xp_cmdshell来完成它。我不建议使用xp_cmdshell。
DECLARE @FilesInAFolder TABLE (FileNames VARCHAR(500))
DECLARE @File VARCHAR(500)
INSERT INTO @FilesInAFolder
EXEC MASTER..xp_cmdshell 'dir /b c:\'
DECLARE CU CURSOR FOR
SELECT 'c:\' + FileNames
FROM @FilesInAFolder
WHERE RIGHT(FileNames,4) = '.xml'
OPEN CU
FETCH NEXT FROM CU INTO @File
WHILE @@FETCH_STATUS = 0
BEGIN
INSERT INTO dbo.articles(id, title, contents)
SELECT X.article.query('id').value('.', 'INT'),
X.article.query('article').value('.', 'VARCHAR(50)'),
X.article.query('/doc/text()').value('.', 'VARCHAR(MAX)')
FROM (
SELECT CAST(x AS XML)
FROM OPENROWSET(
BULK @File,
SINGLE_BLOB) AS T(x)
) AS T(x)
CROSS APPLY x.nodes('doc') AS X(article);
FETCH NEXT FROM CU INTO @File
END
CLOSE CU
DEALLOCATE CU