如何获取在IE中打开的网页的XML代码(不使用WebRequest)?

时间:2012-12-17 08:25:03

标签: c# html xml

我正在尝试从wabpage中获取XML文本,该文本已在IE中打开。由于目标页面的安全性(带有证书的漫长故事等),不允许Web请求。我使用方法遍历所有打开的页面,如果我发现与页面的URI匹配,我需要得到它的XML。 前段时间我需要在 body 标记之间获取HTML代码。我使用 IHTMLDocument2 这样的方法:

private string GetSourceHTML()
{            
    Regex reg = new Regex(patternURL);
    Match match;
    string result;
    foreach (SHDocVw.InternetExplorer ie in shellWindows)
    { 
        match = reg.Match(ie.LocationURL.ToString());
        if (!string.IsNullOrEmpty(match.Value))
        {
            mshtml.IHTMLDocument2 doc = (mshtml.IHTMLDocument2)ie.Document;
            result = doc.body.innerHTML.ToString();
            return result;
        }                
    }
    result = string.Empty;
    return result;            
}

所以现在我需要获得目标页面的完整XML代码。我已经google了很多,但没有发现任何有用的东西。有任何想法吗?感谢。

1 个答案:

答案 0 :(得分:1)

你试过这个吗?它应该得到HTML,希望你可以解析为XML?