从字符串java / gwt中解析htmltags

时间:2011-07-12 13:45:38

标签: java html string parsing gwt

嘿我想从html中解析一些我用字符串发送给我的数据。 我想要的数据是大写的,我会在这里命名为DATAx。 数据的长度是任意的。

http://pastebin.mozilla.org/1270216

还有更多这样的行,我必须解析。

回答问题!

2 个答案:

答案 0 :(得分:2)

我对jsoup祝你好运。它使用jQuery样式的dom节点选择器,可以处理HTML片段,甚至是格式很差的片段。

答案 1 :(得分:0)

我不知道jsoup,但是TagSoup是一个很棒的HTML解析库。我已经在生产系统中使用了几年,现在已经在数万个(至少)网页上运行了,而且我们从未遇到过来自TagSoup的单一故障。它甚至可以处理可以想象的格式最糟糕的HTML。