Question

我只想从当前DOM中获取一个简单的单页HTML转储，其中包含html标记及其间的所有内容。

我尝试过使用SavePageType变体，但没有一个能够满足我的需要。

当我使用SavePageType.COMPLETE_HTML时，它会弄乱html并更改所有资源链接并下载我不想要的资源。

我无法使用SavePageType.MHTML选项。

当我使用SavePageType.ONLY_HTML时，它可以完美地保存，但它不会保存对奇怪的DOM所做的更改。

我也试过获取html元素但是GetElementByTagName找不到它。 html，head和body标签也会丢失，即使它提供了那些非常奇怪的标签内部的内容。

有没有办法使用DotNetBrowser捕获修改后的html（没有问题）？

Answer 1

这是Eugene。我与创建DotNetBrowser的团队合作。

如果我理解正确，您需要保存已加载的网页的修改过的HTML内容。

在这种情况下，您可以使用Browser.GetHTML()方法获取当前HTML，然后使用File.WriteAllText()方法将其保存到文件中。以下源代码演示了如何执行此操作：

string html = browser.GetHTML();
File.WriteAllText("path/to/file.html", html);