页面源代码如下所示:
<td class="ftd">${row.time}</td>
<td class="mntd">${$item.getMTitle(row.movieId)}</td>
<td class="hntd" style="width:75px">${row.hall}</td>
<td class="ptd">${row.price}</td>
<td class="btd"><img class="butres" src="/image.png" alt=""/></td>
浏览器web-inspector中的最终代码如下所示:
<td class="ftd">Item1</td>
<td class="mntd">Item2</td>
<td class="hntd" style="width:75px">Item3</td>
<td class="ptd">Item4</td>
<td class="btd"><img class="butres" src="/image.png" alt=""></td>
我正在尝试解析网页:
Document doc = Jsoup.connect("http://domain.com/").timeout(0).get();
但它只获得源代码。我怎样才能获得“编译”代码?
感谢。
答案 0 :(得分:0)
如果您向我们提供了网址,则可以更轻松地提供帮助。 jsoup不执行JS(它是一个HTML解析器),这就是你没有看到数据的原因。我的猜测是,使用mustache.js作为模板,数据来自ajax请求的json。
您可以通过使用浏览器的网络监视器或Charles之类的代理加载页面并查看网络请求来确定此问题。然后你可以使用jsoup或其他工具来获取数据URL和一个json解析器来解析它。