如何在下载时提取pdf的标题?

时间:2015-09-22 01:51:02

标签: pdf web scripting

我经常处理pdf但是当我尝试下载它时,它通常不包含pdf / paper的实际标题,所以我必须在大多数时候重命名它,我发现很讨厌。

在很多情况下,URL没有pdf的标题,所以我想这必须通过处理pdf的内容来提取。它需要在客户端完成,即,例如,作为浏览器插件?  当我通过脚本或某些方式通过网络下载pdf时,有没有办法获得标题?

1 个答案:

答案 0 :(得分:0)

这很可能不会起作用,这就是原因。

  1. 您必须编写一些令人难以置信的动态代码来获取PDF的某种标题。您必须拥有扫描网站的代码,以某种方式选择一个标题,然后启动计算机上运行的代码请求以更改名称。
  2. 这样会有点不方便,因为您必须始终在您的计算机上运行脚本(可能始终打开终端)。

  3. 您的代码很容易出错。如果您的网站脚本搞砸了,您可能会错误地将PDF命名为错误,然后根据名称的不准确程度找不到它。

  4. 目前,我建议处理手动编辑PDF名称的痛苦。