我不知道在这里问这个问题是否合适,但如果有人能给我一个非常感激的小费。
我需要从网站下载一些PDF文件。我可以通过点击网站上的链接来查看每个页面,当我复制链接地址然后将其粘贴到另一个选项卡时,它将显示“404 not found”。我尝试将链接粘贴到所有浏览器,Internet Download Manager和其他一些浏览器,但邮件总是“找不到”。
有人可以解释网站所有者对此做了什么,以便您必须留在网站上阅读PDF吗?而且(如何)我能够绕过这个限制?
这是网站:
http://service.citroen.com/ddb/(选择一个模型,然后会出现PDF手册)。
尝试右键单击页面,然后复制链接地址,然后将其粘贴到其他位置。
答案 0 :(得分:1)
使用Chrome浏览器 在浏览器中查看PDF文档时 - 右键单击并选择“打印” 您会在右侧看到“目的地” - 按“更改”按钮并选择 “另存为PDF”
Voila .............
答案 1 :(得分:0)
您可以通过查看html代码找到PDF文件的真实路径:http://service.citroen.com/ddb/modeles/c5/c5_c5/ed10-07/de_de/4_21_c5-al-ed10-2007.pdf 也许他们用404链接覆盖它以防止下载。
编辑:实际上你不需要搜索链接。将鼠标悬停在pdf的右侧,您将看到“保存” - 图标。
答案 2 :(得分:0)
在Safari中,我能够右键单击包含PDF的标签,然后选择“将PDF另存为...”。工作得很好。尝试使用其他浏览器。
答案 3 :(得分:0)
有时,某些Web开发人员会在容器中运行PDF以防止人们下载它们。不确定您的网站是否属实。
答案 4 :(得分:0)
我想你的问题将转移到superuser.com。
如果您在浏览器中禁用了pdf插件,它会为您提供可以复制的pdf的完整网址。
答案 5 :(得分:0)
他们做了一些JavaScript事件捕获技巧,他们抓住你点击菜单上的链接的事件,解析链接中的URL(这是坏的,如你所说),找出你想要的文件,然后切换PDF容器,用于显示该站点的正确子目录中的该文件。
实际上代码似乎评论得很好,但我不懂法语。
答案 6 :(得分:0)
有些网站会混淆图像和pdf之类的链接,以防止您“保存”副本。这通常是使用Javascript完成的,通常会产生一条对话框消息,其效果为“我们不希望您下载此内容”
由于您实际上无法在没有实际下载功能的情况下查看浏览器内的内容,因此这种“复制保护”实际上只是冒烟。如果你安装了像“web developer”或“fire bug”这样的工具(两者都适用于Firefox),你有机会在Javascript被它破坏之后查看页面的来源。此类来源将包含有效的下载链接。