可能重复:
Recommend a HTML Validator in java
How to validate HTML from Java?
我如何能够检查某些字符串是否代表有效的HTML代码? (能够在HTML代码之前和之后有空格)
例如,字符串<html><body><h1>My First Heading</h1><p>My first paragraph.</p></body></html>
将返回true,因为它是有效的HTML。
但是,以下字符串<html><body><h1>p>My first paragraph.</p></body></html>
将返回false,因为它不是有效的HTML。
答案 0 :(得分:0)
最好使用HTML解析,也许JTidy非常合适。