从URL获取PDF的原始创建日期

时间:2013-01-24 21:50:09

标签: php url date pdf

我正在使用此网址末尾的pdf

https://www2.blackrock.com/webcore/litService/search/getDocument.seam?venue=PUB_INS&source=CONTENT&serviceName=PublicServiceView&ContentID=51648

通过查看,我们可以看到它是12/31/2012版本。有没有办法可以在pdf本身上获得一些时间戳数据?上传日期,创建日期,修改日期,该球场中的任何内容?

我尝试了以下内容并返回12/31/1969

$pdfURL = 'https://www2.blackrock.com/webcore/litService/search/getDocument.seam?venue=PUB_INS&source=CONTENT&serviceName=PublicServiceView&ContentID=51648';
$rawPDF = file_get_contents($pdfURL);
echo date("F d Y H:i:s.", filemtime($pdfURL));

-AND-

echo date("F d Y H:i:s.", filemtime($rawPDF));

我也试过

$headerArray = array();
$headerArray = get_headers($pdfURL, 1);
echo "<PRE>";
var_dump($headerArray);
echo "</PRE>";

但是标题数组

中不存在Last-Modified

1 个答案:

答案 0 :(得分:2)

我之前回答过,因为我只提供了一个链接,主持人删除了我的回答并转换为评论。现在让我们根据我们的评论尝试更完整的答案:

根据我的分析,给定链接的HTTP标头包含Last-modified字段。但仅当链接直接指向文件时。但是,如果您发现某个链接属于somepage.pgp?file=file.pdf种类,则最后修改的内容不会出现。 在第一种情况下,可以使用php函数get_headers()来读取相关字段。我是后一种情况,我担心我无法帮助你。