c#,html-agility-pack获取不在标签内的文本

时间:2015-12-07 13:15:25

标签: c# html-agility-pack

这是我的HTML:

<a class="bla"></a>
25 oct 2012

我怎么才能获得2012年10月25日。文本不在任何标签内。 我正在使用c#htmlagilitypack库。

1 个答案:

答案 0 :(得分:3)

基本上,您可以使用text()来引用XPath中的文本节点。尝试将以下XPath传递给HtmlAgilityPack的SelectNodes()SelectSingleNode()方法:

//a[@class='bla']/following-sibling::text()[1]

简要说明:

  • //a[@class='bla']:在HTML文档中的任何位置找到<a>属性等于class ...
  • "bla"元素
  • /following-sibling::text()[1]:然后从此<a>返回
  • 后面最近的文本节点