Android jSoup帮助

时间:2011-05-26 06:56:54

标签: android html-parsing jsoup

我正在尝试使用jSoup从此网址http://skyalipi.blogspot.com/2011/04/there-is-no-resistance-without.html解析html。我正在使用此代码

Document doc = Jsoup.parse("http://skyalipi.blogspot.com/2011/04/there-is-no-resistance-without.html");  

       Log.d("test", "the elements"+doc);

在日志中,我得到以下内容

05-26 12:05:05.355: DEBUG/test(696): the elements<html>
05-26 12:05:05.355: DEBUG/test(696):  <head></head>
05-26 12:05:05.355: DEBUG/test(696):  <body>
05-26 12:05:05.355: DEBUG/test(696):   http://skyalipi.blogspot.com/2011/04/there-is-no-resistance-without.html 
05-26 12:05:05.355: DEBUG/test(696):  </body>
05-26 12:05:05.355: DEBUG/test(696): </html>

我想获得段落内容。我不知道我哪里错了。我也提到了以下网址http://jsoup.org/cookbook/extracting-data/attributes-text-html请帮忙

1 个答案:

答案 0 :(得分:1)

Jsoup将您的URL视为您要解析的文本,并将其转换为有效的HTML,以便对其进行解析。我想你想连接到网站并检索该网址的内容,然后解析结果:

Document doc = Jsoup.connect("http://skyalipi.blogspot.com/2011/04/there-is-no-resistance-without.html").get();

修改

查看the documentation示例。你可以这样做:

Element example = doc.getElementById("alternatives1");
Log.d("test","example "+example.text());