当元素具有属性时,无法使用XPATH检索XML元素值

时间:2014-03-24 01:24:07

标签: sql sql-server sql-server-2008 tsql sqlxml

我必须抓取给定XML的元素,为每个元素生成xpath,然后检索每个元素的值:

我能够创建第一步和第二步,但是当一个元素具有属性时,XPATH不起作用:

所以,如果我有以下XPATH:

/Envelope[1]/Body[1]/sVerify[1]/verifyPost[1]/Message[1]/Error[1]
/Envelope[1]/Body[1]/sVerify[1]/verifyPost[1]/scope[1]/machine[1]/space[1]
/Envelope[1]/Body[1]/sVerify[1]/verifyPost[1]/scope[1]/Date[1]

适用于Below XML,并且能够正确获取元素值:

-- Works: I can retrieve the Elements values using XPATH
<Envelope xmlns:s="http://schemas.xmlsoap.org/soap/envelope/">
    <Body>
        <sVerify>
            <verifyPost>
                <scope>
                    <machine>
                        <name>test</name>
                        <space>test2</space>
                    </machine>
                    <Sys>internal</Sys>
                    <Date>2013-02-28</Date>
                </scope>
                <Message>
                    <Error>11111111111</Error>
                    <Descrip>222222222</Descrip>
                </Message>
                <Final>true</Final> 
                <Receipt>33333</Receipt>
            </verifyPost>
        </sVerify>
    </Body>
</Envelope>

请注意,我必须手动删除所有的attirbutes才能使XPATH正常工作。如果XML如下所示,它不起作用:

-- Doesn't work: can't get the elements value
<Envelope xmlns:s="http://schemas.xmlsoap.org/soap/envelope/">
    <Body>
        <sVerify xmlns="http://www.myCompany.com/Location/2014">
            <verifyPost>
                <scope>
                    <machine xmlns:i="http://www.myCompany.com/Location/2014">
                        <name>test</name>
                        <space>test2</space>
                    </machine>
                    <Sys>internal</Sys>
                    <Date>2013-02-28</Date>
                </scope>
                <Message xmlns="http://www.myCompany.com/Location/2014">
                    <Error>11111111111</Error>
                    <Descrip>222222222</Descrip>
                </Message>
                <Final xmlns="http://www.myCompany.com/Location/2014">true</Final>  
                <Receipt>33333</Receipt>
            </verifyPost>
        </sVerify>
    </Body>
</Envelope>

可以有任意数量的属性,所以我从来不知道这些属性会是什么。确保XPATH始终能够找到给定元素的值的正确方法是什么,无论它是否具有属性。

以下是我在TSQL中执行它的方式:

DECLARE @generatedXPATH nvarchar(500),
    @elementVal nvarchar(50),
    @xml xml,
    @query nvarchar(max)

-- it works with this payload
-- because attributes aren't there replacing it with xml
-- where element attributes are present fails the element value extraction using xpath 
SET @xml = '<Envelope xmlns:s="http://schemas.xmlsoap.org/soap/envelope/"> <Body> <sVerify> <verifyPost> <scope> <machine> <name>test</name> <space>test2</space> </machine> <Sys>internal</Sys> <Date>2013-02-28</Date> </scope> <Message> <Error>11111111111</Error> <Descrip>222222222</Descrip> </Message> <Final>true</Final> <Receipt>33333</Receipt> </verifyPost> </sVerify> </Body> </Envelope>'

SET @generatedXPATH = '/Envelope[1]/Body[1]/sVerify[1]/verifyPost[1]/scope[1]/machine[1]/space[1]'
SET @elementVal = ''
SET @query = N'SELECT @elementVal=    Nodes.node.value(''(' + @generatedXPATH
                           + ')[1]'', ''varchar(50)'')  FROM   @xml.nodes(''.'') AS Nodes(node)'; 

exec sp_ExecuteSql 
@query, 
N' @xml xml,@elementVal nvarchar(max) output', 
@xml = @xml, 
@elementVal = @elementVal output

select @elementVal 

更新

似乎只有属性没有前缀的属性才会导致问题。例如,如果属性为xlmns="...........",那么我无法使用XPATH获取其值,如果属性为xlmns:i =&#34; ..........&#34;然后它似乎工作。不知道发生了什么。

1 个答案:

答案 0 :(得分:1)

如果你有一个带有自定义命名空间的XML,你需要定义它并使用它作为该命名空间下使用WITH XMLNAMESPACES(http://technet.microsoft.com/en-us/library/ms177607.aspx)定义的每个元素的词缀。在你的情况下,试试这个:

SET @generatedXPATH = '/Envelope[1]/Body[1]/ns:sVerify[1]/ns:verifyPost[1]/ns:scope[1]/ns:machine[1]/ns:space[1]'
SET @elementVal = ''
SET @query = N'WITH XMLNAMESPACES (''http://www.myCompany.com/Location/2014'' AS ns) 
    SELECT @elementVal=    Nodes.node.value(''(' + @generatedXPATH
                           + ')[1]'', ''varchar(50)'')  FROM   @xml.nodes(''.'') AS Nodes(node)'; 

编辑:如果您不知道命名空间,使用*而不是ns应该可以用于获取元素而不管命名空间:

SET @generatedXPATH = '/Envelope[1]/Body[1]/*:sVerify[1]/*:verifyPost[1]/*:scope[1]/*:machine[1]/*:space[1]'
SET @elementVal = ''
SET @query = N'SELECT @elementVal=    Nodes.node.value(''(' + @generatedXPATH
                           + ')[1]'', ''varchar(50)'')  FROM   @xml.nodes(''.'') AS Nodes(node)';