如何保存在DotNetBrowser控件中加载的已修改网页?

时间:2017-12-29 12:30:50

标签: dotnetbrowser

我只想从当前DOM中获取一个简单的单页HTML转储,其中包含html标记及其间的所有内容。

我尝试过使用SavePageType变体,但没有一个能够满足我的需要。

当我使用SavePageType.COMPLETE_HTML时,它会弄乱html并更改所有资源链接并下载我不想要的资源。

我无法使用SavePageType.MHTML选项。

当我使用SavePageType.ONLY_HTML时,它可以完美地保存,但它不会保存对奇怪的DOM所做的更改。

我也试过获取html元素但是GetElementByTagName找不到它。 html,head和body标签也会丢失,即使它提供了那些非常奇怪的标签内部的内容。

有没有办法使用DotNetBrowser捕获修改后的html(没有问题)?

1 个答案:

答案 0 :(得分:1)

这是Eugene。我与创建DotNetBrowser的团队合作。

如果我理解正确,您需要保存已加载的网页的修改过的HTML内容。

在这种情况下,您可以使用Browser.GetHTML()方法获取当前HTML,然后使用File.WriteAllText()方法将其保存到文件中。以下源代码演示了如何执行此操作:

string html = browser.GetHTML();
File.WriteAllText("path/to/file.html", html);