用Java清理Html5页面:有可能吗?

时间:2012-07-12 16:29:59

标签: java html5 java-7 jtidy

我需要清理Java项目中的Html5页面。

所以我需要一个Java库,或者在Linux和Windows上都能运行的命令行程序。

JTidy效果不佳(我测试过)。 HTML Tidy for HTML5是一个C ++库,它的命令行版本仅适用于Linux。

你知道Validator.nu HTML Parser是否也可以清理(我没有找到任何关于它的信息)?

你有什么想法吗?

由于

1 个答案:

答案 0 :(得分:0)

使用JSoup。很好的支持,没有本机组件(应该在Java的任何地方运行),免费但非常自由的许可证。另外,支持HTML5