将单行HTML文件划分为格式良好的HTML文件

时间:2012-06-26 12:41:43

标签: java html parsing

我有一个HTML文件,其中所有标签都在一行中。我想将每个标签分开并将其放在自己的行上。最终目标是拥有格式良好的HTML文件。

e.g。

<html><head><title>StackOverflow</title></head><body></body></html>

将转换为:

<html>
    <head>
        <title>
        StackOverflow
        </title>
    </head>
    <body>
    </body>
</html>

是否有现有的Java库来处理这个问题?

1 个答案:

答案 0 :(得分:2)

您的问题与格式良好的HTML文件无关。即使html标签在同一行,也不意味着html没有很好地形成。 你实际需要的只是一个格式化程序,它基本上会使你的html更具人性化。 您可以查看JTidy,也可以选择进行语法检查。