Question

我有这个xml：

<Item id="3" idLevel="3">
    <Label qualifier="Usual">
        <LabelText language="ALL">BE01</LabelText>
    </Label>
    <Label qualifier="Usual">
        <LabelText language="EN">R&#xc9;GION DE BRUXELLES-CAPITALE / BRUSSELS HOOFDSTEDELIJK GEWEST</LabelText>
    </Label>
</Item>
<Item id="4" idLevel="3">
    <Label qualifier="Usual">
        <LabelText language="ALL">BE001</LabelText>
    </Label>
    <Label qualifier="Usual">
        <LabelText language="EN">VLAAMS GEWEST</LabelText>
    </Label>
</Item>
<Item id="123" idLevel="3">
    <Label qualifier="Usual">
        <LabelText language="ALL">RO001</LabelText>
    </Label>
    <Label qualifier="Usual">
        <LabelText language="EN">MACROREGIUNEA DOI</LabelText>
    </Label>
</Item>

我想获取<LabelText language="EN">的值，其中邻居<LabelText language="ALL">以＆＃34; BE＆＃34;之后有3个数字。

在这种情况下，我会在示例中获得第二个xml元素的值：VLAAMS GEWEST

我知道如何以uggly的方式处理它，但我相信应该有更灵活和优雅的方式来实现它：

$crawler = new Crawler();
$crawler->addXmlContent($xml);
$crawler = $crawler->filterXPath('//Item[@idLevel="3"]');

foreach ($crawler as $domElement) {
    // here I check if inside element's neighbour has value of "BE" and three numbers after with regex
}

有没有办法用DomCrawler处理它而不是迭代所有元素并检查每个元素？

Answer 1

您可以使用单个XPath表达式来获取所需的文本：

//Item[@idLevel="3"]/Label[string-length(preceding-sibling::Label/LabelText/text()) = 5 and starts-with(preceding-sibling::Label/LabelText/text(), "BE") and number(substring(preceding-sibling::Label/LabelText/text(), 3)) = number(substring(preceding-sibling::Label/LabelText/text(), 3))]/LabelText[@language="EN"]/text()

打破它：

//Item[@idLevel="3"] - 获取Item个idLevel个属性，其值为3
/Label - 其Label个孩子......
[string-length(preceding-sibling::Label/LabelText/text()) = 5 - 文本长度等于5的兄弟Label/LabelText个节点...
and starts-with(preceding-sibling::Label/LabelText/text(), "BE") - 并以BE
and number(substring(preceding-sibling::Label/LabelText/text(), 3)) = number(substring(preceding-sibling::Label/LabelText/text(), 3))] - 最后3个字符是数字
/LabelText[@language="EN"]/text() - 获取LabelText节点的文字，其中language属性包含文字EN

Symfony2 - DomCrawler - 通过它在正则表达式中的邻居内容获取元素的内容

1 个答案: