Question

[您好，我很久以来一直在解决此类问题，但未获得任何富有成果的结果，这使我从StackOverflow的高级人员那里获得了帮助，因为我在C＃控制台应用程序中使用HtmlAgilityPack进行Web抓取，因为我已经附加了图像，我想从头开始解析div，直到h3标签包含超链接，如何使用HTML敏捷包来做到这一点。

我尝试了多种解决方案来解析，但没有取得丰硕的成果。

也附有图片1

代码在这里：

        static string url = "https://www.rozee.pk/job/jsearch/q/all/fc/1184/fin/1/";
        HtmlWeb web = new HtmlWeb();
        HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument();
        doc = web.Load(url);
        var nodes = doc.DocumentNode.SelectSingleNode("//div[@class='job-listing opages npages']/div[@class='j-area']/div[@class='jlist float-left']/div[@class='job']/div[@class='jcont']/div[@class='jhead']/div[@class='jobt float-left']/h3[@title]/a[@href]").InnerText;
        Console.WriteLine(nodes);`

它给出

空引用异常未处理。使用new关键字create 对象的实例。

Answer 1

string htmlText = doc.ParsedText;

这将为您提供您尝试获取的html页面的内容。因此，您确实会在此文本文件中找到尝试获取的特定标签。例如：<bdi>Wordpress Developer</bdi>

您将无法在该html内容中看到此标记。

原因：HTML敏捷包无法加载动态内容。它不充当您的浏览器。它只是帮助您解析html文本。因此，您可以浏览或遍历html。

阅读this，以便您能读懂文章。

提示：如果您仔细看一下doc.parsedText，您会找到一个包含您要查找的数据的脚本。

如何解析div，因为我要在h3标签内建立超链接

1 个答案: