我需要html解析,它能够识别生成的html中的错误,如果标签没有关闭,则关闭它并返回有效的html。
更多细节:我从数据库获取数据并打破该记录以显示我网站上的部分详细信息,点击更多按钮,然后显示完整内容。打破字符串然后验证。
我已经使用过Html Agility Pack,但我是新用的,如果这个库解决了我的问题,那么请指导我如何(教程)或建议我另一个库。
答案 0 :(得分:1)
以下是来自万维网联盟W3C的几个验证程序:
Windows:http://validator.w3.org/docs/install_win.html
UNIX / Linux:http://validator.w3.org/docs/install.html
您还可以使用其网络服务来验证您的CSS,HTML,XML,XHTML,JavaScript以及许多其他网络技术。 W3C是保持互联网高度互操作性和互联网设备相互兼容的监督者之一。
答案 1 :(得分:1)
我不认为这样的图书馆确实存在。问题是,某些库确实可以识别HTML中的错误,但他们无法为您修复它们。
我认为使用W3C validator作为服务是这里最好的起点。有一个开源库,它使用W3C验证器的API来验证文档,并在有效或无效时给出响应以及错误和警告。我会从这开始,然后从那里继续。