直观地提取html元素

时间:2014-07-19 18:33:11

标签: c# html css extract

嗨,这是我关于stackoverflow的第一个问题,所以很好。

我想提取一个html元素,但不仅仅是它应该保留它的风格和功能的元素。所以我想要选择想要的html元素,然后从所有其他元素中删除所有删除所有样式。我要问的是:

  1. 我做了什么删除
    • 显然我必须从父元素中删除所有样式属性,例如高度宽度 backgroundColor ,...
    • 除此之外,还有 id标记,因为它们可以像css那样从css或somenthing中获取样式(这会影响我想要的子元素)以某种方式缺少的方式来消化?)
    • 我要删除其他父元素的所有内容(除了脚本标记之外,还会删除所有父元素吗?)
    • 删除不是所选元素的父级或子级的所有其他元素发辫
  2. 我可以不删除的内容是什么?
    • Skript标签我不应该删除原因,因此我可能会失去功能
    • 另外,我不应该删除Html标签正文标记以保持有效的Html
  3. 在保留并删除所有想要和不需要的内容之后,我只想要所选元素及其内容和子元素。如果所选元素是表单或包含表单,则表单应该100%工作。

    你能帮我完成这个清单和一些想法除了html还需要考虑什么吗?

    谢谢!

    我尝试用C#mshtml / agilitypack进行此操作,但这并不相关。

    这样我就可以在我的webbrowser中显示一个(选定的)html元素,但保留它的功能。

1 个答案:

答案 0 :(得分:0)

好吧有些css它很简单! :)

仅设置可见性属性。我认为将父亲的最高可见度设置为崩溃并且您想要显示的元素设置为可见就足够了。

也许你必须设置所有父级的可见性才能崩溃。也许有人可以提供一些信息,我是否正确地假设除了可见性以外,父母可以看到的元素是否具有可见性?

这是什么,答案集父母将父母的可见性设置为折叠,并且您想要的孩子可见。