所以我试图通过PHP来获取页面的HTML源代码:
$doc = file_get_contents('http://myanimelist.net/animelist/0000RIP0000');
var_dump($doc);
但据我所知,这个特定的页面只能通过Javascript加载,也就是说,它不会返回我想要的HTML,因为PHP不会渲染javascript部分。
答案 0 :(得分:0)
永远不会呈现Javascript,因为它是在客户端运行的。 如果javascript正在目标服务器上运行并在您的服务器上失败, 检查,如果你有所有需要的外部JavaScript文件。
答案 1 :(得分:0)
使用Mink(浏览器模拟器)和SeleniumHQ(浏览器自动化)在页面上加载和运行javascript。然后通过注入一个javascript来提取模拟页面内容,该javascript扫描模拟DOM以获取所需内容。 Mink将允许您从PHP服务器中执行此操作。