使用C#保存包含所有样式和图像的HTML页面?

时间:2010-04-16 13:48:04

标签: c# html

如何在 C#中保存包含所有样式和图片的HTML页面?我需要对浏览器的“保存”功能进行编程实现,该功能不依赖于 Internet Explorer (WebBrowser组件)。

2 个答案:

答案 0 :(得分:2)

我有类似的事要解决。最大的问题是来自CSS的图像,它们很难解析。

所以,我选择使用FiddlerCore来实现这一目标。

也可以帮助你。

您的任务的难点在于创建自己的结构,并相应地更改图像路径。

答案 1 :(得分:1)

我不认为这很容易。

使用webclient下载页面的所有HTML,并将文本写入HTML文件。然后使用html-parser查找所有链接的图像并将其保存在子目录中。为CSS做同样的事情。

如果您不想保存所有图像,只需将页面的URL添加到图像的所有链接的开头即可。另请注意,某些URL:s不是相对的,您必须对此进行补偿。并且不要忘记扫描所有链接图像的css文件