如何从C#中的HTML文件中提取图像URL

时间:2009-04-26 09:35:40

标签: c# .net html parsing extract

任何人都可以通过解释如何从C#

中的HTML文件中提取图像网址来帮助我

2 个答案:

答案 0 :(得分:26)

HTML Agility Pack可以做到这一点 - 只需使用像// img这样的查询并访问src - 就像这样:

string html;
using (WebClient client = new WebClient()) {
    html = client.DownloadString("http://www.google.com");
}
HtmlDocument doc = new HtmlDocument();        
doc.LoadHtml(html);
foreach(HtmlNode img in doc.DocumentNode.SelectNodes("//img")) {
    Console.WriteLine(img.GetAttributeValue("src", null));
}

答案 1 :(得分:1)

你必须解析HTML并检查img标签使用以下链接它包含用于解析HTML标签的C#库我面对你的问题b4我使用这个库并且与我合作Parsing HTML tags