从实时网站中提取动态值

时间:2015-03-06 14:20:41

标签: java

我想从实时网站中提取一些值到我的应用程序中。那怎么办呢? 例如,如果我想从任何一个网站中提取比赛得分。我该怎么做?

2 个答案:

答案 0 :(得分:0)

您可以使用JSOUP(http://jsoup.org/)进行屏幕抓取。他们的cookbook有很多例子。

例如,您可以按类型(在本例中为div)连接到URL提取HTML元素:

Document document = Jsoup.connect("http://your-site.com/page.html").get();
Elements paragraphs = document.select("div");

答案 1 :(得分:0)

另一种方法是使用正则表达式的向下和脏的方式。您可以按照java doc

获取网站的HTML内容

http://docs.oracle.com/javase/tutorial/networking/urls/readingURL.html

显然,你需要知道你的拉动网站显示数据的格式结构,就像你看来的那样。因此,当您阅读HTML内容时,您可以对您提到的<td class="batteamdesc boldclass">进行regExp搜索,并获取该标记之间的所有数据。