PHP file_get_contents / CURL没有返回整页

时间:2013-01-02 13:58:42

标签: php curl file-get-contents

我正在尝试使用CURL或file_get_contents来尝试提取第三方文件内容,读取页面的pasrt,但它会在随机位置停止...但没有错误(超时等)。

如果我给出完整的例子,可能最容易看到!:

使用以下非常bsic脚本来读取完整的URL并返回内容工作正常,页面的完整内容(少了一些外部css等)在一两秒内完成:

<?php    
set_time_limit(180);
$page = file_get_contents('http://www.fantasyleague.com/Classic/Stats/playerlist.aspx?dpt=3');
echo $page;
?>

但是,如果我们改为

<?php    
set_time_limit(180);
$page = file_get_contents('http://www.fantasyleague.com/Classic/Stats/playerlist.aspx?dpt=4');
echo $page;
?>

运行需要很长时间,最终会返回页面的一部分,但不是全部。它并不一致,但它通常以“A Westwood AV 3.6 12”或“show”结尾,稍微向上一点。

如果你看两个网址,你会发现它们基本上是相同的。这种行为已经开始发生,直到一两天前,两者都运行良好。

有什么想法吗?我可以提供我错过的任何进一步信息!

编辑:

文件完成位置的示例...原始文件包含:

<div class="right">
    <a id="Playerlist_help_button" class="button left" href="#"><div>Show help</div></a>
    <a id="Playerlist_filters_button" class="button left" href="#"><div>Show filters</div></a>
    <a class="button left" href="PlayerListPrintable.aspx" target="_blank"><div>Printable Version</div></a>
    <br class="clear" />
</div>

但检索到的数据停在:

<div class="right">
    <a id="Playerlist_help_button" class="button left" href="#"><div>Show help</div></a>
    <a id="Playerlist_filters_button" class="button left" href="#"><div>Show 

或经常失败的其他地方是:

        <td><div class="chilli normal" /></td>


        <td>12</td>


        <td>0</td>

变为:

        <td><div class="chilli normal" /></td>


        <td>12</td>

1 个答案:

答案 0 :(得分:0)

通过file_get_contents或curl一次只能获得html源而不是所有组件