Java HTML解析器/验证器

时间:2010-12-24 01:40:29

标签: xml xsd html-parsing xml-parsing xhtml

我们允许人们在类似wiki的网站上输入HTML代码。但只有有限的HTML子集不会影响我们的样式并且不允许恶意javascript代码。服务器端是否有一个好的Java库,以确保输入的代码有效?

我们尝试创建XML Schema文档以进行验证。唯一的问题是我们用来验证的库给出了隐藏的错误消息。我想要的是验证库实际修复问题(如果有一个style =“”属性添加到元素, 删除它 )。如果修复它并不容易,至少允许我向用户报告错误位置的消息(我可以提供一条好消息的错误代码很好,甚至可能更好)。

1 个答案:

答案 0 :(得分:0)

尝试JSoup。我想这就是你要找的东西: JSoup