标签: java html string parsing gwt
嘿我想从html中解析一些我用字符串发送给我的数据。 我想要的数据是大写的,我会在这里命名为DATAx。 数据的长度是任意的。
http://pastebin.mozilla.org/1270216
还有更多这样的行,我必须解析。
回答问题!
答案 0 :(得分:2)
我对jsoup祝你好运。它使用jQuery样式的dom节点选择器,可以处理HTML片段,甚至是格式很差的片段。
答案 1 :(得分:0)
我不知道jsoup,但是TagSoup是一个很棒的HTML解析库。我已经在生产系统中使用了几年,现在已经在数万个(至少)网页上运行了,而且我们从未遇到过来自TagSoup的单一故障。它甚至可以处理可以想象的格式最糟糕的HTML。