使用Jsoup获取“编译”的HTML页面

时间:2013-11-17 17:23:29

标签: java html jsoup

页面源代码如下所示:

<td class="ftd">${row.time}</td>
<td class="mntd">${$item.getMTitle(row.movieId)}</td>
<td class="hntd" style="width:75px">${row.hall}</td>
<td class="ptd">${row.price}</td>
<td class="btd"><img class="butres" src="/image.png" alt=""/></td>

浏览器web-inspector中的最终代码如下所示:

<td class="ftd">Item1</td>
<td class="mntd">Item2</td>
<td class="hntd" style="width:75px">Item3</td>
<td class="ptd">Item4</td>
<td class="btd"><img class="butres" src="/image.png" alt=""></td>

我正在尝试解析网页:

Document doc = Jsoup.connect("http://domain.com/").timeout(0).get();

但它只获得源代码。我怎样才能获得“编译”代码?

感谢。

1 个答案:

答案 0 :(得分:0)

如果您向我们提供了网址,则可以更轻松地提供帮助。 jsoup不执行JS(它是一个HTML解析器),这就是你没有看到数据的原因。我的猜测是,使用mustache.js作为模板,数据来自ajax请求的json。

您可以通过使用浏览器的网络监视器或Charles之类的代理加载页面并查看网络请求来确定此问题。然后你可以使用jsoup或其他工具来获取数据URL和一个json解析器来解析它。