使用Html Agility Pack进行Web抓取数据

时间:2016-07-24 14:14:41

标签: html-agility-pack

使用Html Agility Pack,如何从html代码中获取字符串ABC:

  def average(list: List[Double]): Double =
    list.foldLeft(0.0)(_ + _) / list.foldLeft(0.0)((r, c) => r + 1)

1 个答案:

答案 0 :(得分:1)

您需要做的就是获取元素的InnerText。您正在搜索TD元素,因此请让HtmlAgilityPack选择此类元素,您将在其InnerText属性中找到html元素的文本。

根据您的样本:

string html = @"<td><a data-quoteapi='$cur.symbol href=/asx/{$cur.symbol} (stockLink)' href='/asx/abc'>ABC</a></td>";

HtmlDocument doc = new HtmlDocument();
doc.LoadHtml(html);

var selectedElement = doc.DocumentNode.SelectSingleNode("td");

if (selectedElement != null)
    Console.WriteLine(selectedElement.InnerText); //prints ABC