我一直在试图从外部网站提取meta tag
信息。我开始使用XML
方法,但由于标记链接doctype
等,我的应用程序不断抛出错误。
我现在采用HttpResponse
方法,我知道如何将网站恢复并作为字符串存储在变量中但
我无法弄清楚如何从内容中提取子字符串 元标记?
我几天来一直在寻找这个问题的解决方案。提前谢谢!
答案 0 :(得分:3)
使用HTML Agility Pack下载,解析和查询外部HTML。
答案 1 :(得分:1)
我从未尝试使用元标记,但对于HTML文档而言,Html Agility Pack是一个很好的解决方案。有关示例,请参阅此blog post。