有没有办法可以用C#检查HTML的语法

时间:2012-12-06 10:19:48

标签: c# html xml html-parsing

我有一个编辑窗口,允许我的授权用户输入HTML,然后在点击提交后将其存储在数据库中。不幸的是它是这样的:

<ul class="controls-buttons">
         <li class="sep"></li>
     <li id="home">
<a title="Home" <a="" data-href="x">xx</a></li>
      </ul>

有没有办法在将HTML字符串存储到数据库之前检查HTML字符串以确保它是有效的HTML标记?例如,请注意使用<a<a

2 个答案:

答案 0 :(得分:2)

您可以将片段加载到HTML Agility Pack(HTML解析器)中。源代码下载包含许多显示用法的示例项目。

检查ParseErrors属性以查看片段是否有效。

答案 1 :(得分:-1)

您的下一个最佳方法是将C#和.NET与Regex对象一起使用。只需使用符合您要求的正则表达式,并根据正则表达式验证内容。