我正在寻找一个解析HTML的简单轻量级java库。我看了很多,那里有很多选择。但我找不到简单的东西。除了在java中,我真的希望python中有pyquery之类的东西。我的要求是:快速,易用和轻便。
我需要什么?不确定这是否重要,但我需要索引部分html文档。所以我希望能够快速选择该文档的一部分,然后解析它。
答案 0 :(得分:6)
我过去使用过HTMLParser。我对此并不满意。我找到了tagoup和jsoup。我非常喜欢jsoup。还没有广泛使用它,但你可以做类似的事情:
Elements resultLinks = doc.select("h3 > a"); // direct a after h3
答案 1 :(得分:2)
尝试groovy。它有许多“诽谤者”,它们是用于读取标记的DSL,如XML和HTML,以及JSON。例如here。
答案 2 :(得分:1)
答案 3 :(得分:0)
如果您想要一个类似jQuery的库,正如您的问题标题所示,您应该查看GWT。
GWT可让您浏览网页的DOM。 试试教程,在30分钟内你会确定你是否想知道更多...
答案 4 :(得分:0)
看看看起来很有前途的杰瑞 http://jodd.org/doc/jerry/