抓取重定向的页面

时间:2011-05-19 09:20:47

标签: php

我正在尝试从服务器获取文件.pdf。页面上有一个超链接,点击该链接进入页面,它会检查一些权限,然后重定向到另一个页面,显示iframe中的.pdf内容。

让我们说开头的网址是http://site.com/docs/1.pdf 点击它转到另一个页面,然后另一个页面,它来到最后一页 http://site.com/viewer/pdfs/1.pdf 最后一页显示了iframe中的pdf内容。

我意识到软件IDM(Internet下载管理器)可以按照重定向并通过单击第一个链接下载文件。

我想知道是否有算法或库或类或提示我可以弄清楚如何在PHP脚本中执行此操作。

顺便说一下,一旦我编写了一个代码来读取页面的标题,我可以重定向到第二页,但我想知道是否有一般的算法。

2 个答案:

答案 0 :(得分:3)

如果您手动执行HTTP操作,请检查30x状态代码和Location标题。

但是,您只需使用CURL并设置CURLOPT_FOLLOWLOCATION

答案 1 :(得分:1)

是的,就像ThiefMaster说的那样,你可以寻找Location标题。 看看这里,也许这可以帮助你: http://codesnippets.joyent.com/posts/show/1214此函数检索远程文件的文件大小,为什么不尝试稍微更改它以获取最终的URL?