我有一个输入String
,其中包含一些HTML片段,如下例
I would have enever thought that <b>those infamous tags</b>,
born in the <abbr title="Don't like that acronym">SGML</abbr> realm,
would make their way into the web of objects that we now experience.
显然,真正的一个是复杂的(包括链接,iamges,div等),我想编写一个具有以下原型的方法
String toXHTML(String html) {
// What do I have to write here ?
}
答案 0 :(得分:0)
如果没有输入格式的描述,它可能会是一些类似html的东西。 解析这样一团糟很快就会变得难看。但看起来其他人已经做得很好了:
#!/usr/bin/env groovy
@Grapes(
@Grab(group='jtidy', module='jtidy', version='4aug2000r7-dev')
)
import org.w3c.tidy.*
def tidy = new Tidy()
tidy.parse(System.in, System.out)
使用力量,Riduidel。
答案 1 :(得分:0)
看看这个:http://blog.foosion.org/2008/06/09/parse-html-the-groovy-way/ 这可能是你正在寻找的东西。