我有几个(媒体)网站的自动存档&#39;首页,用php编写。具体来说,我每天两次复制<body>
标签中的html,我有他们所有css和js文件的副本,所以我可以从过去的任何一点重新创建首页。现在,我遇到了其中一个网站的问题,因为他们用ajax调用加载主滑块内容(最重要的新闻)。我希望在解析数据之前执行此ajax调用,而不仅仅是空白div。通过环顾四周,我发现他们使用了一个名为lof-jslidernews2
的wordpress插件,但是我无法找到特定的ajax调用来查看url并发出curl请求。任何想法如何实现这一目标?
我的代码(必须像这样手动解析,因为DomDocument和无效的html存在一些问题):
// ...
if($html = file_get_contents ($row['page_url'])) {
$content = strstr($html, '<body');
$content = str_before($content, '</body>') . '</body>';
$filename = date('YmdHis') . $row['page_name'];
if($success = file_put_contents ('app/webroot/files/' . $filename, $content)) {
// ....
**我的项目没有任何违法行为,我没有窃取内容,只是为了以后的比较而冻结前台。我已经咨询了一位律师。 :)
答案 0 :(得分:1)
我不知道为什么,但实际解决我问题的家伙删除了他的答案。所以,这是:
他建议使用模拟器,特别是Mink。它很容易安装(使用作曲家),并在第一次尝试时完成了工作。很棒的图书馆。
Mink是一个用于Web应用程序的开源浏览器控制器/模拟器,用PHP 5.3编写。