Question

我正在尝试从wabpage中获取XML文本，该文本已在IE中打开。由于目标页面的安全性（带有证书的漫长故事等），不允许Web请求。我使用方法遍历所有打开的页面，如果我发现与页面的URI匹配，我需要得到它的XML。前段时间我需要在 body 标记之间获取HTML代码。我使用 IHTMLDocument2 这样的方法：

private string GetSourceHTML()
{            
    Regex reg = new Regex(patternURL);
    Match match;
    string result;
    foreach (SHDocVw.InternetExplorer ie in shellWindows)
    { 
        match = reg.Match(ie.LocationURL.ToString());
        if (!string.IsNullOrEmpty(match.Value))
        {
            mshtml.IHTMLDocument2 doc = (mshtml.IHTMLDocument2)ie.Document;
            result = doc.body.innerHTML.ToString();
            return result;
        }                
    }
    result = string.Empty;
    return result;            
}

所以现在我需要获得目标页面的完整XML代码。我已经google了很多，但没有发现任何有用的东西。有任何想法吗？感谢。

Answer 1

你试过这个吗？它应该得到HTML，希望你可以解析为XML？

Retrieving the HTML source code

如何获取在IE中打开的网页的XML代码（不使用WebRequest）？

1 个答案: