如何使用groovy将一些HTML片段转换为XHTML?

时间:2011-07-08 09:19:06

标签: html xhtml groovy

我有一个输入String,其中包含一些HTML片段,如下例

I would have enever thought that <b>those infamous tags</b>, 
born in the <abbr title="Don't like that acronym">SGML</abbr> realm,
would make their way into the web of objects that we now experience.

显然,真正的一个是复杂的(包括链接,iamges,div等),我想编写一个具有以下原型的方法

String toXHTML(String html) {
     // What do I have to write here ?
}

2 个答案:

答案 0 :(得分:0)

如果没有输入格式的描述,它可能会是一些类似html的东西。 解析这样一团糟很快就会变得难看。但看起来其他人已经做得很好了:

#!/usr/bin/env groovy
@Grapes(
    @Grab(group='jtidy', module='jtidy', version='4aug2000r7-dev')
)
import org.w3c.tidy.*
def tidy = new Tidy()
tidy.parse(System.in, System.out)

使用力量,Riduidel。

答案 1 :(得分:0)

看看这个:http://blog.foosion.org/2008/06/09/parse-html-the-groovy-way/ 这可能是你正在寻找的东西。