Question

我正在尝试解析/search?id=3

下面的html代码中的第一个链接

<div class="brs_col">
  <p>
    <a href="/search?id=3">
      <b>
        vastu shastra
      </b>
    </a>
  </p>
  <p>
    <a href="/search?id=1">
      <b>
        bygga
      </b>
      bastu
    </a>
  </p>
</div>

我尝试使用以下XPATH选择它，但似乎无法使其中任何一个工作：

//div[@class='brs_col']//p//a[@href]
//div[@class='brs_col']//p[0]//a[@href]
//div[@class='brs_col']//p//a[0][@href]

有什么想法吗？

Answer 1

试试这个：

var doc = new HtmlDocument();
doc.LoadHtml(@"<div class=""brs_col"">
                  <p><a href=""/search?id=3""><b>vastu shastra</b></a></p>
                  <p><a href=""/search?id=1""><b>bygga</b>bastu</a></p>
                </div>");
var hrefValue = doc.DocumentNode
                   .SelectSingleNode("//div[@class='brs_col']/p/a")
                   .Attributes["href"]
                   .Value;

Answer 2

你可以试试这个

doc.DocumentNode.SelectNodes("//a[@href]").FirstOrDefault();

Answer 3

如果您确定这是整个HTML文档中的第一个网址：

doc.DocumentNode.SelectSingleNode("//a").Attributes["href"].Value;

如果您确定这是brs_col类中的第一个ulr

，请执行此操作

doc.DocumentNode.SelectSingleNode("//div[@class='brs_col']//a").Attributes["href"].Value;

c＃htmlagilitypack解析div与class的第一个链接？

3 个答案: