我正在尝试使用xpath在线获取pokerstars.co.uk上的玩家数量:
//*[@id="ncPlayers"]
但span[id=ncPlayers]
的内容空白,当我查看pokerstars.co.uk的源代码时,内容也是隐藏的,他们如何做到这一点以及如何绕过它? / p>
答案 0 :(得分:1)
他们可能会用javascript来填补这个范围。
或者他们在javascript中静态声明它,或者他们使用javascript从服务器请求(使用jQuery或POST请求,通过使用jQuery或其他一些javascript库)。在第一种情况下,您可以刮取javascript并提取数字。在第二种情况下,您可以自己执行请求并解析返回的JSON或任何数据。
无论哪种方式,你都必须深入研究网站上使用的javascript源代码。
感谢Brendan,我确实访问了该网站并发现该网站加载了来自
的JSON内容http://www.psimg.com/datafeed/dyn_banners/summary.json.js
答案 1 :(得分:0)
他们用javascript填充范围。所以它不包含在页面的HTML源代码中,只是在javascript的DOM中。您可以获取ajax请求,该请求会接收玩家数量。