如何解析div,因为我要在h3标签内建立超链接

时间:2019-06-06 13:27:50

标签: c# html-agility-pack

[您好,我很久以来一直在解决此类问题,但未获得任何富有成果的结果,这使我从StackOverflow的高级人员那里获得了帮助,因为我在C#控制台应用程序中使用HtmlAgilityPack进行Web抓取,因为我已经附加了图像,我想从头开始解析div,直到h3标签包含超链接,如何使用HTML敏捷包来做到这一点。

我尝试了多种解决方案来解析,但没有取得丰硕的成果。

也附有图片1

代码在这里:

        static string url = "https://www.rozee.pk/job/jsearch/q/all/fc/1184/fin/1/";
        HtmlWeb web = new HtmlWeb();
        HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument();
        doc = web.Load(url);
        var nodes = doc.DocumentNode.SelectSingleNode("//div[@class='job-listing opages npages']/div[@class='j-area']/div[@class='jlist float-left']/div[@class='job']/div[@class='jcont']/div[@class='jhead']/div[@class='jobt float-left']/h3[@title]/a[@href]").InnerText;
        Console.WriteLine(nodes);`

它给出

  

空引用异常未处理。使用new关键字create   对象的实例。

1 个答案:

答案 0 :(得分:0)

string htmlText = doc.ParsedText;

这将为您提供您尝试获取的html页面的内容。因此,您确实会在此文本文件中找到尝试获取的特定标签。 例如:<bdi>Wordpress Developer</bdi>

您将无法在该html内容中看到此标记。

原因:HTML敏捷包无法加载动态内容。它不充当您的浏览器。它只是帮助您解析html文本。因此,您可以浏览或遍历html。

阅读this,以便您能读懂文章。

提示:如果您仔细看一下doc.parsedText,您会找到一个包含您要查找的数据的脚本。