来自GeckoWebBrowser.Document.DocumentElement.InnerHtml
属性的Html代码与从服务器下载的html不同,因为它被转换为DOM,并且可能存在更改文档结构的Javascript。
如何获取真实的网页来源?
答案 0 :(得分:3)
有一种方法:
GeckoWebBrowser.ViewSource();
或
GeckoWebBrowser.ViewSource(string url);
打开一个新窗口,其中包含当前(或指定)页面的源代码。如果您只想要文本,请尝试:
GeckoWebBrowser.Navigate("view-source:" + url);
答案 1 :(得分:0)
我有一种解决问题的新方法:
GeckoWebBrowser1.Navigate("about:blank")
Me.Delay(1)
让你的功能在这里等待1秒
GeckoWebBrowser1.Navigate("view-source:" + "YourUrl")