如何以编程方式验证网页的标记?

时间:2012-02-20 17:55:48

标签: asp.net html regex validation

我需要以编程方式验证网页标记,我听说可以使用正则表达式。如果是这样的话?还有其他方法吗? (除了使用w3c服务)

1 个答案:

答案 0 :(得分:1)

使用HTML Tidy http://tidy.sourceforge.net/它会报告HTML文档的有效性,并可以尝试自动清理它。您可以将其作为命令行应用程序运行并编写脚本。 Java,Perl和Python中都有端口或包装器。

我也使用TagSoup库for Java http://ccil.org/~cowan/XML/tagsoup/它很好地将格式错误的HTML清理成有效的XML。