使用C#从HTML中删除样式和JavaScript

时间:2011-12-20 23:57:26

标签: javascript .net html c#-4.0

我想要做的是从HTML页面中删除所有JavaScript和CSS代码段并获取纯HTML代码。我怎么能正确地做到这一点?

3 个答案:

答案 0 :(得分:2)

您始终可以使用Html Agility Pack尝试解析HTML,删除有问题的脚本/样式节点,然后输出其余节点。

答案 1 :(得分:0)

另一篇热门答案为Using C# regular expressions to remove HTML tags

的帖子

另一种选择,也许不是优雅但更安全的选择是将html传递给第三方服务并解释结果

答案 2 :(得分:0)

非常感谢,不幸的是,可以在不使用HTML标记的情况下将JS和CSS放到HTML中。您可以使用CSS的style属性来执行此操作,并且可以将JS绑定到event以获取按钮,例如也可以使用属性。我认为有优雅,自动的方式来清理HTML ...:/