Java使用JSOUP从HTML源代码获取RSS链接

时间:2012-05-27 07:10:11

标签: java rss jsoup html-parser

我正在尝试从html源代码获取RSS链接。我使用Jsoup java库来查找rss链接。我写了一小段代码来获取RSS链接,但遗憾的是它并不适用于所有网站。以下是我的代码

String url = "http://www.smashingmagazine.com/"; // not working
Document doc = Jsoup.connect(url).get();
Elements links = doc.select("link[type=application/rss+xml]");

if (links.size() > 0) {
    String rss_url = links.get(0).attr("href").toString();
} else {
    // RSS url not found
}

上述代码不适用于所有网站。请解决我的问题。 (我试图找到RSS 2.0链接)

谢谢

1 个答案:

答案 0 :(得分:2)

答案是:

String url = "http://www.smashingmagazine.com/"; // not working
Document doc = Jsoup.connect(url).get();

Elements links = doc.select("link[type=application/rss+xml]");

if (links.size() > 0) {
    String rss_url = links.get(0).attr("abs:href").toString();
} else {....
    // RSS url not found
}

我希望你会好起来的。 它适用于.attr(* “abs: * href”)

ERTU