[您好,我很久以来一直在解决此类问题,但未获得任何富有成果的结果,这使我从StackOverflow的高级人员那里获得了帮助,因为我在C#控制台应用程序中使用HtmlAgilityPack进行Web抓取,因为我已经附加了图像,我想从头开始解析div,直到h3标签包含超链接,如何使用HTML敏捷包来做到这一点。
我尝试了多种解决方案来解析,但没有取得丰硕的成果。
也附有图片1
代码在这里:
static string url = "https://www.rozee.pk/job/jsearch/q/all/fc/1184/fin/1/";
HtmlWeb web = new HtmlWeb();
HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument();
doc = web.Load(url);
var nodes = doc.DocumentNode.SelectSingleNode("//div[@class='job-listing opages npages']/div[@class='j-area']/div[@class='jlist float-left']/div[@class='job']/div[@class='jcont']/div[@class='jhead']/div[@class='jobt float-left']/h3[@title]/a[@href]").InnerText;
Console.WriteLine(nodes);`
它给出
空引用异常未处理。使用new关键字create 对象的实例。
答案 0 :(得分:0)
string htmlText = doc.ParsedText;
这将为您提供您尝试获取的html页面的内容。因此,您确实会在此文本文件中找到尝试获取的特定标签。
例如:<bdi>Wordpress Developer</bdi>
您将无法在该html内容中看到此标记。
原因:HTML敏捷包无法加载动态内容。它不充当您的浏览器。它只是帮助您解析html文本。因此,您可以浏览或遍历html。
阅读this,以便您能读懂文章。
提示:如果您仔细看一下doc.parsedText,您会找到一个包含您要查找的数据的脚本。