如何在java中阅读动态网站内容

时间:2017-12-24 17:24:58

标签: java

根据html源代码:

{result.data}

请求URL result.data设置为100,并且能够在浏览器中看到值为100。当我尝试使用相同的url请求执行java程序时,我无法看到我在浏览器中看到的值。

网址网址=新网址(网站) url.openConnection()等..

我想通过java程序获得与浏览器中看到的内容相同的内容。

2 个答案:

答案 0 :(得分:-1)

据我所知,你想做以下事情之一:

  1. 您不想逐行阅读结果,而是希望将其解析为XML,以便遍历div(s)和其他html标记。
    • 为此,我建议您使用jsoup库。
  2. 当您在浏览器中点击URL:www.abcd.com/number=500时,它会加载一个空div并在加载时从某个地方获取数据,这个数据在加载时获取,您想使用java获取它吗?
    • 为此,在结果页面中必须有一些js,它通过在页面加载时点击一些服务来获取数据,您需要在页面中查找以了解服务详细信息而不是点击此URL({ {1}})您需要点击该服务才能获取数据。

答案 1 :(得分:-1)

您的问题不是很具描述性,但我想您正试图从网站上抓取数据。 您可以使用以下库执行此任务:

  1. Jaunt(http://jaunt-api.com

  2. Jsoup(http://jsoup.org/cookbook/extracting-data/dom-navigation

  3. 的HtmlUnit