Html Agility Pack Xpath

时间:2016-02-19 13:46:51

标签: c# xpath html-agility-pack

如何将此xPath与Html Agility Pack一起使用?

XPATH:

//div[@class='test']/(text())[last()]

我已尝试过此代码:

foreach (HtmlNode node in doc.DocumentNode.SelectNodes("//div[@class='test']/(text())[last()]"))
            {
                test = node.InnerText();
            }

HTML:

<div class="test">
        <ul>
            <li><b>Test1</b>Test1 Text</li>
            <li><b>Test2</b>Test2 Text</li>
        </ul>
    </div>

我需要提取&#34; Test2 Text&#34;没有特定的xPath中的ul标记。

1 个答案:

答案 0 :(得分:3)

您可以尝试使用此XPath:

(//div[@class='test']//text()[normalize-space()])[last()]

//div[@class='test']//text()[normalize-space()]div中找到所有非空文本节点。然后,[last()]仅返回所有找到的文本节点中的最后一个节点。

工作演示示例(在线查看here

var html = @"<div class='test'>
<ul>
    <li><b>Test1</b>Test1 Text</li>
    <li><b>Test2</b>Test2 Text</li>
</ul>
";
HtmlDocument doc = new HtmlDocument();
doc.LoadHtml(html);
HtmlNode node = doc.DocumentNode.SelectSingleNode("(//div[@class='test']//text()[normalize-space()])[last()]");
Console.WriteLine(node.InnerText);

输出

Test2 Text