如何在安全性的HTML中嵌入pdf文件?

时间:2015-08-31 10:46:36

标签: html security pdf

我使用下面的代码以HTML格式显示pdf文件

<object data="data/file.pdf" type="application/pdf" width="300" height="200">
<a href="data/file.pdf">test.pdf</a>
</object>


但是在上面的代码中,我们必须指定路径名和文件夹名,这样它就不那么安全了。 Crawler可以找到这条路径,因此使用一些算法(机器人)可以很容易地下载存储在该文件夹中的其他文件。
如何确保这一点,是否有任何选项可以防止机器人出现这种情况?。

2 个答案:

答案 0 :(得分:1)

您可以执行以下操作:

  • 密码保护页面(使用服务器端代码)。
  • 为每个PDF文件(使用服务器端代码)生成类似( /getpdf/some_random_string_or_md5_hash_of_random_string.pdf )的唯一链接,a)检查当前时间和生成的随机名称的有效性(如果它已过期或未过期)则b)将重定向到源文件(因为重定向而不是真正隐藏源)要显示或流式传输PDF文件内容(这样更安全,但可能会严重增加负载到服务器)。
  • 最后将robots.txt添加到该文件夹​​,并希望抓取工具遵循它设置的限制。

答案 1 :(得分:0)

如果不下载目录中的其他文件,则它们不应位于http服务器可用的目录中。您可以在http服务器中使用目录权限(例如,Apache中的config指令和.htaccess)来控制对目录的访问。仅配置您需要向Web公开的目录的访问权限,并仅存储您希望Web访问的文件。

如果要避免在HTML中包含路径,则需要编写一些动态代码(例如,php,asp或任意数量的服务器端选项)。您在服务器上的代码需要处理文件请求并手动返回文件的内容。