我想要做的是从HTML页面中删除所有JavaScript和CSS代码段并获取纯HTML代码。我怎么能正确地做到这一点?
答案 0 :(得分:2)
您始终可以使用Html Agility Pack尝试解析HTML,删除有问题的脚本/样式节点,然后输出其余节点。
答案 1 :(得分:0)
另一篇热门答案为Using C# regular expressions to remove HTML tags
的帖子另一种选择,也许不是优雅但更安全的选择是将html传递给第三方服务并解释结果
答案 2 :(得分:0)
非常感谢,不幸的是,可以在不使用HTML标记的情况下将JS和CSS放到HTML中。您可以使用CSS的style
属性来执行此操作,并且可以将JS绑定到event
以获取按钮,例如也可以使用属性。我认为有优雅,自动的方式来清理HTML ...:/