实际上,我是Web爬网的新手,我正在使用HtmlAgilityPack在c#中进行爬网。自从我坚持解决问题2天以来,这对我来说真的很忙。我希望有人可以帮助我。这是url HTML数据的附件图像。我想要的是标题名称而不是输出中的item.title。
static string url="https://xyzabc.com";
static void Main(string[] args)
{
getJobeeData();
Console.Read();
}
static void getJobeeData()
{
HtmlWeb html = new HtmlWeb();
HtmlAgilityPack.HtmlDocument doc = new HtmlDocument();
doc = html.Load(url);
var title = doc.DocumentNode.SelectNodes("//a[@ng-href]//p");
if (title == null)
{
Console.WriteLine("Error");
}
else if (title != null)
{
foreach (var item in title)
{
Console.WriteLine("Jobee Jobs Data" + item.InnerText + "\n");
}
}
}
我得到的输出是这样的:
OutputImage