如何从InternetExplorer对象查看源HTML?

时间:2013-02-08 20:40:51

标签: c# .net

当我实例化IE对象并导航到url时,我不知道如何从该地址获取源HTML代码。

这是我正在使用的代码:

SHDocVw.InternetExplorer IE = new SHDocVw.InternetExplorer();
IE.Visible = false;
IE.Navigate("www.testsite.com");

我想要类似的东西:

string source = IE.ToSource();

所以我可以检查它的内容。 我能做到吗?感谢。

1 个答案:

答案 0 :(得分:4)

试试:

SHDocVw.InternetExplorer IE = new SHDocVw.InternetExplorer();
IE.Visible = false;
IE.Navigate("www.testsite.com");
mshtml.IHTMLDocument2 htmlDoc 
         = IE.Document as mshtml.IHTMLDocument2;
string content = htmlDoc.body.outerHTML;

您可以从body.parent属性访问整个HTML字符串:

string content = htmlDoc.body.parent.outerHTML;

You can see a nice example here (the example in c++)