使用PHP来解析aspx

时间:2011-12-12 10:27:15

标签: php asp.net parsing

让我们看一下这页http://bet.hkjc.com/football/default.aspx?ci=en-US

在此页面中,如果我点击任何链接,则网址相同(无变化) 所以,如果我想解析/查看源代码,那么html与我想要的不一样 那么,如何获取真实的URL并查看正确的源代码以便我可以解析页面?

3 个答案:

答案 0 :(得分:3)

简短的回答是你没有。 ASPX就像PHP一样在服务器上处理,从不发送给访问者,所以你不会得到源。


该页面包含iFrame中的内容。您可以按照iFrame中的网址获取内容。

在该特定网页上,所有显示HTML都是通过javascript创建的,用于按下数组中的数据,您可以在iFrame的源文件中找到该数据(例如,请参阅http://bet.hkjc.com/football/index.aspx?lang=ch)。 / p>

假设您只对数据而不是格式化详细信息感兴趣,您所要做的就是弄清楚数组的组织方式并简单地导入数组。根本不需要解析HTML。

现在,真正的问题是您是否有权使用该内容。它默认受版权保护,因此除非您有明确的许可,否则您应该考虑您对此内容的使用是否属于合理使用条款。如果您打算在您的网站上显示内容,这绝对不是“合理使用”,您无权这样做。

答案 1 :(得分:2)

看起来该页面使用Javascript加载新内容。这就是为什么网址不会改变的原因。如果您发现内容的加载位置,您也可以从中获取内容。

使用Firebug并观看网络标签以找到正确的网址。

答案 2 :(得分:0)

您需要结合使用DOM监控(如通过firebug)和HTTP请求监控(如“Live HTTP Headers”插件)。这将允许您通过AJAX样式调用和用户启动的调用(表单提交等)监视客户端javascript和服务器本身之间生成的流量。

ASPX使用几种技术维护会话,您需要使用php代码和curl或类似方法进行模拟。这确实很棘手。

另请注意,您可能需要密切关注HTTP标头 - 取决于服务器的设置方式,如果它与精确匹配,它可能会拒绝批发请求。