我正在尝试使用jSoup从此网址http://skyalipi.blogspot.com/2011/04/there-is-no-resistance-without.html解析html。我正在使用此代码
Document doc = Jsoup.parse("http://skyalipi.blogspot.com/2011/04/there-is-no-resistance-without.html");
Log.d("test", "the elements"+doc);
在日志中,我得到以下内容
05-26 12:05:05.355: DEBUG/test(696): the elements<html>
05-26 12:05:05.355: DEBUG/test(696): <head></head>
05-26 12:05:05.355: DEBUG/test(696): <body>
05-26 12:05:05.355: DEBUG/test(696): http://skyalipi.blogspot.com/2011/04/there-is-no-resistance-without.html
05-26 12:05:05.355: DEBUG/test(696): </body>
05-26 12:05:05.355: DEBUG/test(696): </html>
我想获得段落内容。我不知道我哪里错了。我也提到了以下网址http://jsoup.org/cookbook/extracting-data/attributes-text-html请帮忙
答案 0 :(得分:1)
Jsoup将您的URL视为您要解析的文本,并将其转换为有效的HTML,以便对其进行解析。我想你想连接到网站并检索该网址的内容,然后解析结果:
Document doc = Jsoup.connect("http://skyalipi.blogspot.com/2011/04/there-is-no-resistance-without.html").get();
修改强>
查看the documentation示例。你可以这样做:
Element example = doc.getElementById("alternatives1");
Log.d("test","example "+example.text());