解析没有名字或id的“div”,只有类atrribute,在android中使用htmlClener

时间:2015-06-14 07:11:53

标签: android parsing htmlcleaner

我正在尝试解析具有div元素且唯一class属性的HTML网页。 我需要从中提取信息。 它是多个div元素,所以我需要遍历DOM。但我无法识别div元素。

2 个答案:

答案 0 :(得分:0)

切换到Jsoup,真的太棒了!

在我看来,你应该使用。它是Java HTML解析器。其功能如下所列。

  • 能够从网络获取网页
  • 非常简单直接的API
  • 用于tagert HTML元素的CSS选择器。

例如,您希望获得类foo

的DIV元素
Document doc = Jsoup.connect("http://website.com/").get();
Elements divs = doc.select("div.foo");

答案 1 :(得分:0)

如果您使用HtmlCleaner的JDom序列化程序,则可以使用XPath表达式来定位div。