我必须抓取给定XML的元素,为每个元素生成xpath,然后检索每个元素的值:
我能够创建第一步和第二步,但是当一个元素具有属性时,XPATH不起作用:
所以,如果我有以下XPATH:
/Envelope[1]/Body[1]/sVerify[1]/verifyPost[1]/Message[1]/Error[1]
/Envelope[1]/Body[1]/sVerify[1]/verifyPost[1]/scope[1]/machine[1]/space[1]
/Envelope[1]/Body[1]/sVerify[1]/verifyPost[1]/scope[1]/Date[1]
适用于Below XML,并且能够正确获取元素值:
-- Works: I can retrieve the Elements values using XPATH
<Envelope xmlns:s="http://schemas.xmlsoap.org/soap/envelope/">
<Body>
<sVerify>
<verifyPost>
<scope>
<machine>
<name>test</name>
<space>test2</space>
</machine>
<Sys>internal</Sys>
<Date>2013-02-28</Date>
</scope>
<Message>
<Error>11111111111</Error>
<Descrip>222222222</Descrip>
</Message>
<Final>true</Final>
<Receipt>33333</Receipt>
</verifyPost>
</sVerify>
</Body>
</Envelope>
请注意,我必须手动删除所有的attirbutes才能使XPATH正常工作。如果XML如下所示,它不起作用:
-- Doesn't work: can't get the elements value
<Envelope xmlns:s="http://schemas.xmlsoap.org/soap/envelope/">
<Body>
<sVerify xmlns="http://www.myCompany.com/Location/2014">
<verifyPost>
<scope>
<machine xmlns:i="http://www.myCompany.com/Location/2014">
<name>test</name>
<space>test2</space>
</machine>
<Sys>internal</Sys>
<Date>2013-02-28</Date>
</scope>
<Message xmlns="http://www.myCompany.com/Location/2014">
<Error>11111111111</Error>
<Descrip>222222222</Descrip>
</Message>
<Final xmlns="http://www.myCompany.com/Location/2014">true</Final>
<Receipt>33333</Receipt>
</verifyPost>
</sVerify>
</Body>
</Envelope>
可以有任意数量的属性,所以我从来不知道这些属性会是什么。确保XPATH始终能够找到给定元素的值的正确方法是什么,无论它是否具有属性。
以下是我在TSQL中执行它的方式:
DECLARE @generatedXPATH nvarchar(500),
@elementVal nvarchar(50),
@xml xml,
@query nvarchar(max)
-- it works with this payload
-- because attributes aren't there replacing it with xml
-- where element attributes are present fails the element value extraction using xpath
SET @xml = '<Envelope xmlns:s="http://schemas.xmlsoap.org/soap/envelope/"> <Body> <sVerify> <verifyPost> <scope> <machine> <name>test</name> <space>test2</space> </machine> <Sys>internal</Sys> <Date>2013-02-28</Date> </scope> <Message> <Error>11111111111</Error> <Descrip>222222222</Descrip> </Message> <Final>true</Final> <Receipt>33333</Receipt> </verifyPost> </sVerify> </Body> </Envelope>'
SET @generatedXPATH = '/Envelope[1]/Body[1]/sVerify[1]/verifyPost[1]/scope[1]/machine[1]/space[1]'
SET @elementVal = ''
SET @query = N'SELECT @elementVal= Nodes.node.value(''(' + @generatedXPATH
+ ')[1]'', ''varchar(50)'') FROM @xml.nodes(''.'') AS Nodes(node)';
exec sp_ExecuteSql
@query,
N' @xml xml,@elementVal nvarchar(max) output',
@xml = @xml,
@elementVal = @elementVal output
select @elementVal
更新
似乎只有属性没有前缀的属性才会导致问题。例如,如果属性为xlmns="..........."
,那么我无法使用XPATH获取其值,如果属性为xlmns:i =&#34; ..........&#34;然后它似乎工作。不知道发生了什么。
答案 0 :(得分:1)
如果你有一个带有自定义命名空间的XML,你需要定义它并使用它作为该命名空间下使用WITH XMLNAMESPACES(http://technet.microsoft.com/en-us/library/ms177607.aspx)定义的每个元素的词缀。在你的情况下,试试这个:
SET @generatedXPATH = '/Envelope[1]/Body[1]/ns:sVerify[1]/ns:verifyPost[1]/ns:scope[1]/ns:machine[1]/ns:space[1]'
SET @elementVal = ''
SET @query = N'WITH XMLNAMESPACES (''http://www.myCompany.com/Location/2014'' AS ns)
SELECT @elementVal= Nodes.node.value(''(' + @generatedXPATH
+ ')[1]'', ''varchar(50)'') FROM @xml.nodes(''.'') AS Nodes(node)';
编辑:如果您不知道命名空间,使用*而不是ns应该可以用于获取元素而不管命名空间:
SET @generatedXPATH = '/Envelope[1]/Body[1]/*:sVerify[1]/*:verifyPost[1]/*:scope[1]/*:machine[1]/*:space[1]'
SET @elementVal = ''
SET @query = N'SELECT @elementVal= Nodes.node.value(''(' + @generatedXPATH
+ ')[1]'', ''varchar(50)'') FROM @xml.nodes(''.'') AS Nodes(node)';