android - 解析没有名字或id的“div”，只有类atrribute，在android中使用htmlClener - Thinbug

解析没有名字或id的“div”，只有类atrribute，在android中使用htmlClener

时间：2015-06-14 07:11:53

标签： android parsing htmlcleaner

我正在尝试解析具有div元素且唯一class属性的HTML网页。我需要从中提取信息。它是多个div元素，所以我需要遍历DOM。但我无法识别div元素。

2 个答案:

答案 0 :(得分：0)

切换到Jsoup，真的太棒了！

在我看来，你应该使用jsoup。它是Java HTML解析器。其功能如下所列。

能够从网络获取网页
非常简单直接的API
用于tagert HTML元素的CSS选择器。

例如，您希望获得类foo

的DIV元素

Document doc = Jsoup.connect("http://website.com/").get();
Elements divs = doc.select("div.foo");

答案 1 :(得分：0)

如果您使用HtmlCleaner的JDom序列化程序，则可以使用XPath表达式来定位div。