我写了这段代码。:
警告,链接指向成人网站!!!
var getHtmlWeb = new HtmlWeb();
var document = getHtmlWeb.Load("http://xhamster.com/movies/2808613/jewel_is_a_sexy_cougar_who_loves_to_fuck_lucky_younger_guys.html");
var aTags = document.DocumentNode.SelectNodes("//div[contains(@class,'noFlash')]");
if (aTags != null)
foreach (var aTag in aTags)
{
var href = aTag.Attributes["href"].Value;
textBox2.Text = href;
}
我尝试运行此程序时出错。
如果我将其他东西放入" var href"例如。:
var href = aTag.InnerHtml
我得到了内部文本,我可以在那里看到" href ="链接和其他一些数据。
但我只需要href之后的链接!
答案 0 :(得分:2)
您正在选择div
元素。 div
元素不具有href
属性。如果您想获得href的锚标记,可以使用:
var hrefs = aTags.Descendants("a")
.Select(node => node.GetAttributeValue("href",""))
.ToList();