如何从网页中提取动态文本

时间:2010-12-17 10:20:49

标签: java web-services

我想从网页上获得一些经常更改的文本。我出租车使用的技术是什么?作为一个例子每天都要改变的货币汇率我想从网页中提取并希望保存在DB中,请参阅让我知道任何人都知道这一点,

thanxx

1 个答案:

答案 0 :(得分:0)

您可以使用JSoup来解析HTML。

示例:

String html = "<p>An <a href='http://example.com/'><b>example</b></a> link.</p>";
Document doc = Jsoup.parse(html);
Element link = doc.select("a").first();

String text = doc.body().text(); // "An example link"
String linkHref = link.attr("href"); // "http://example.com/"
String linkText = link.text(); // "example""

String linkOuterH = link.outerHtml(); 
    // "<a href="http://example.com"><b>example</b></a>"
String linkInnerH = link.html(); // "<b>example</b>"

您可以查找特定的DIV,以这种方式标记,检查example