有没有办法告诉WebBrowser组件C#不要改变原始HTML?

时间:2012-03-23 13:34:34

标签: c# html tags browser

我注意到Web浏览器组件使用的Internet Explorer会修改原始源代码。我发现,由于ajax请求和所有内容,一些代码必须更改。当我声明html被修改时,我指的是那些插入的标签,即使它们不在实际的源代码中。例如,当不存在时,IE完成“body”标记,当表没有时,IE也完成“tbody”标记。有没有办法保留文件的原始结构?

如果你不明白这个问题请告诉我,谢谢。

1 个答案:

答案 0 :(得分:1)

我必须做出一些假设,但这是我的理论:

你所看到的不是IE改变HTML。我不知道你是怎么看到的,但这是IE序列化它的DOM树。当然,IE必须关闭body标签(或者如果我们必须精确地创建body DOM元素)才能呈现某些东西。序列化的DOM不是最初的HTML,如果你想提取原始的HTML,你可能没有使用正确的工具。此行为有时会出现在WSIYWYG编辑器中以及在IE中使用保存页面时。它只是将其内部DOM树转储回字符串,而在DOM树中没有不完整的元素,因为它们是树节点而不是标记。