从网站ASP.NET MVC3中提取元数据

时间:2011-12-19 20:57:59

标签: c# asp.net asp.net-mvc-3 httpresponse meta

我一直在试图从外部网站提取meta tag信息。我开始使用XML方法,但由于标记链接doctype等,我的应用程序不断抛出错误。

我现在采用HttpResponse方法,我知道如何将网站恢复并作为字符串存储在变量中但

  

我无法弄清楚如何从内容中提取子字符串   元标记?

我几天来一直在寻找这个问题的解决方案。提前谢谢!

2 个答案:

答案 0 :(得分:3)

使用HTML Agility Pack下载,解析和查询外部HTML。

答案 1 :(得分:1)

我从未尝试使用元标记,但对于HTML文档而言,Html Agility Pack是一个很好的解决方案。有关示例,请参阅此blog post