刮取时隐藏的跨度值

时间:2012-07-31 14:37:59

标签: php xpath screen-scraping

我正在尝试使用xpath在线获取pokerstars.co.uk上的玩家数量:

//*[@id="ncPlayers"]

span[id=ncPlayers]的内容空白,当我查看pokerstars.co.uk的源代码时,内容也是隐藏的,他们如何做到这一点以及如何绕过它? / p>

2 个答案:

答案 0 :(得分:1)

他们可能会用javascript来填补这个范围。

或者他们在javascript中静态声明它,或者他们使用javascript从服务器请求(使用jQuery或POST请求,通过使用jQuery或其他一些javascript库)。在第一种情况下,您可以刮取javascript并提取数字。在第二种情况下,您可以自己执行请求并解析返回的JSON或任何数据。

无论哪种方式,你都必须深入研究网站上使用的javascript源代码。

感谢Brendan,我确实访问了该网站并发现该网站加载了来自

的JSON内容
http://www.psimg.com/datafeed/dyn_banners/summary.json.js

答案 1 :(得分:0)

他们用javascript填充范围。所以它不包含在页面的HTML源代码中,只是在javascript的DOM中。您可以获取ajax请求,该请求会接收玩家数量。