我只想从当前DOM中获取一个简单的单页HTML转储,其中包含html标记及其间的所有内容。
我尝试过使用SavePageType变体,但没有一个能够满足我的需要。
当我使用SavePageType.COMPLETE_HTML时,它会弄乱html并更改所有资源链接并下载我不想要的资源。
我无法使用SavePageType.MHTML选项。
当我使用SavePageType.ONLY_HTML时,它可以完美地保存,但它不会保存对奇怪的DOM所做的更改。
我也试过获取html元素但是GetElementByTagName找不到它。 html,head和body标签也会丢失,即使它提供了那些非常奇怪的标签内部的内容。
有没有办法使用DotNetBrowser捕获修改后的html(没有问题)?
答案 0 :(得分:1)
这是Eugene。我与创建DotNetBrowser的团队合作。
如果我理解正确,您需要保存已加载的网页的修改过的HTML内容。
在这种情况下,您可以使用Browser.GetHTML()
方法获取当前HTML,然后使用File.WriteAllText()
方法将其保存到文件中。以下源代码演示了如何执行此操作:
string html = browser.GetHTML();
File.WriteAllText("path/to/file.html", html);