将PDF文档放在网页中,而不用搜索引擎索引它们

时间:2014-01-11 19:18:04

标签: html pdf ads

编辑:

这似乎是一个非常好的问题,现在我发现可能有一种方式比我整整一天编写代码更直接的答案。

我发现你可以将它放在.htaccess文件中,并且搜索引擎不会索引pdf文件。太简单了。我想这不是众所周知的,或者有人会在我收到的一个答案附近的7个小时内保存我。

    <FilesMatch "\.pdf$">
        header set x-robots-tag: noindex
    </FilesMatch>

我有一个网站,可以提供pdf文件,并且支持广告。最近谷歌一直在链接到pdf而不是具有嵌入广告和广告的网页。看起来很疯狂,因为它们是谷歌广告,但我觉得对用户很好。我的收入减少了一半。我可以通过创建一个名为.pdf的目录并将文件index.php与相应的头重定向来将Web结果转到另一个页面。在新文件中,我可以重命名pdf,但这只会将问题延迟到索引新位置时。这样做700个文件并不是我每周都想做的事情。

我考虑将pdf文件翻译成html并测试了zamzar windershare,somepdf,intrapdf,但没有一个做得好。有些翻译几乎是可读的,有些只是白页,有些是黑页,有的是黑色页面,里面有一些斑点。我几个小时前尝试过在线服务,但还没有收到我的文件的电子邮件。

我没有将pdf设置为html,这正是我能想到的。

也许有更好的解决方案。其他人必须有这个问题,并以某种方式解决了它。显然我也需要可搜索的页面,所以只是将所有内容转换为图像并不是解决方案。我不知道该怎么做。

2 个答案:

答案 0 :(得分:1)

您必须选择:Google会阅读PDF并将其编入索引 - 因此它们会独立显示在搜索结果中,或者您可以在robots.txt中排除PDF,Google也不会读取PDF并且根本不会将其编入索引

您无法要求Google为PDF编制索引,但仅将此结果应用于父级。要做你想做的事,你需要停止链接到PDF。

如果您使用基于Flash的PDF查看器或其他内容而不是实际链接到iframe中的PDF,那么这可能会解决您的问题。

答案 1 :(得分:0)

您的SEO是否依赖于pdf中的内容?如果没有,您可以创建robot.txt,禁止搜索引擎访问包含pdf文件的文件夹。