我正在使用此网址末尾的pdf
https://www2.blackrock.com/webcore/litService/search/getDocument.seam?venue=PUB_INS&source=CONTENT&serviceName=PublicServiceView&ContentID=51648
通过查看,我们可以看到它是12/31/2012
版本。有没有办法可以在pdf本身上获得一些时间戳数据?上传日期,创建日期,修改日期,该球场中的任何内容?
我尝试了以下内容并返回12/31/1969
$pdfURL = 'https://www2.blackrock.com/webcore/litService/search/getDocument.seam?venue=PUB_INS&source=CONTENT&serviceName=PublicServiceView&ContentID=51648';
$rawPDF = file_get_contents($pdfURL);
echo date("F d Y H:i:s.", filemtime($pdfURL));
-AND-
echo date("F d Y H:i:s.", filemtime($rawPDF));
我也试过
$headerArray = array();
$headerArray = get_headers($pdfURL, 1);
echo "<PRE>";
var_dump($headerArray);
echo "</PRE>";
但是标题数组
中不存在Last-Modified
答案 0 :(得分:2)
我之前回答过,因为我只提供了一个链接,主持人删除了我的回答并转换为评论。现在让我们根据我们的评论尝试更完整的答案:
根据我的分析,给定链接的HTTP标头包含Last-modified字段。但仅当链接直接指向文件时。但是,如果您发现某个链接属于somepage.pgp?file=file.pdf
种类,则最后修改的内容不会出现。
在第一种情况下,可以使用php函数get_headers()
来读取相关字段。我是后一种情况,我担心我无法帮助你。