HTML Agility Pack解析div

时间:2017-07-03 21:59:26

标签: c# parsing html-agility-pack

我试图解析HTML,我需要得到" text"从这一部分:

<div class="_gdf kno-fb-ctx">
    <span data-ved="0ahUKEwjIr9brjO7UAhUnYZoKHda-ALgQ2koIogEoAjAT"> text</span>
</div>

这是我的C#代码:

var message = doc.DocumentNode.SelectSingleNode("//div[@class='_gdf kno-fb-ctx']").InnerText;
Console.WriteLine(message);

我做错了什么?

1 个答案:

答案 0 :(得分:0)

我看到你没有选择实际的'Span'节点来读取InnertTex。您已选择div并尝试阅读InnertTex,它不会为您提供所需的结果“文本”。相反,你可以这样做:

        HtmlAgilityPack.HtmlDocument doc = new HtmlDocument();
        doc.LoadHtml("<div class='_gdf kno-fb-ctx'><span data-ved = '0ahUKEwjIr9brjO7UAhUnYZoKHda-ALgQ2koIogEoAjAT'> text </span ></div >");
        var text = doc.DocumentNode.SelectSingleNode("//div[@class=\"_gdf kno-fb-ctx\"]//span").InnerText;