我想从实时网站中提取一些值到我的应用程序中。那怎么办呢? 例如,如果我想从任何一个网站中提取比赛得分。我该怎么做?
答案 0 :(得分:0)
您可以使用JSOUP(http://jsoup.org/)进行屏幕抓取。他们的cookbook有很多例子。
例如,您可以按类型(在本例中为div)连接到URL提取HTML元素:
Document document = Jsoup.connect("http://your-site.com/page.html").get();
Elements paragraphs = document.select("div");
答案 1 :(得分:0)
另一种方法是使用正则表达式的向下和脏的方式。您可以按照java doc
获取网站的HTML内容http://docs.oracle.com/javase/tutorial/networking/urls/readingURL.html
显然,你需要知道你的拉动网站显示数据的格式结构,就像你看来的那样。因此,当您阅读HTML内容时,您可以对您提到的<td class="batteamdesc boldclass">
进行regExp搜索,并获取该标记之间的所有数据。