网络抓取工具和IFrame

时间:2014-01-22 14:07:27

标签: iframe web-crawler

假设情况:我有一个名为“miniatureBoltsInCarburetors.com”的小型网站,提供有关将化油器固定在一起的微型螺栓的内容以及一些一般相关的汽车信息。我的网站也有一个页面,允许有人在他们的化油器中找到丢失的螺栓,虽然没有人会直接从我的网站访问这个页面,但十亿其他流行的汽车网站已经使用iframe将这个单页嵌入他们的网站,但未包含返回我网站的链接。

我认识到这个问题与SEO有关,这被认为是偏离主题的,然而,所有与SEO相关的论坛都讨论了可以采取的营销步骤,而不是编程步骤或策略,并希望其他人会允许这个问题在这里回答。

我希望我的网站“miniatureBoltsInCarburetors.com”在一般汽车搜索中排名很高。我该怎么做才能让包含iframe的第三方网站回到我的网站来提高我的排名?可以在iframe中使用JavaScript在父页面上创建链接提供任何值吗?当我的服务器呈现页面时,使用PHP从$ _SERVER获取引用URL,并将其包含在内容中呢?

4 个答案:

答案 0 :(得分:3)

我在这里提供解决方案。不确定这是不是你想要的。

在iframe中其他网站使用的页面中,您可以放在Javascript下面。此javascript检查网页是在iframe内打开还是直接在浏览器中打开。

因此,当您看到它在iframe中打开时,请使用此检查。点击导航到您网站的内容。

//这适用于所有浏览器

function inIframe () {
    try {
        return window.self !== window.top;
    } catch () {
        return true;
    }
}

另外供您参考,您可以查看以下网址。 How to prevent my site page to be loaded via 3rd party site frame of iFrame

希望它有所帮助。

答案 1 :(得分:0)

我不认为你需要担心。

谷歌机器人似乎确实在Iframes中抓取,但是包含该iframe的网页不是该内容的信用额。
换句话说,该特定网页的页面排名不会因内容而改变Iframe。

is IFrame crawled by Google?
Do robots crawl iframes?

答案 2 :(得分:0)

Google可以看到iframe的单独页面。由于来自不受信任的网站,您的方法可能最终会受到处罚。根据{{​​3}}

  

帧可能会给搜索引擎带来问题,因为它们不会   对应于网络的概念模型。谷歌试图   将框架内容与包含框架的页面相关联,但我们   不保证我们会。

为特定关键字排名更高的最佳方法之一是制作多个相关网站。在你的情况下,一个3-4页的网站关于化油器,螺栓,你的主要网站包含的其他东西会这样做。由于页数较少,这些迷你网站对主题的关注度会更高。当然,它们应该在每个页面上包含独特的文章。然后从迷你网站链接到主要网站,你可以看到戏剧性的变化。

事实上,你要做的事情就是几年前偶尔对竞争对手进行排名的策略。现在,它仍然存在风险。

答案 3 :(得分:0)

我明白了。您不希望弄乱自己网站的页面,但是您想要对所有未经授权的嵌入执行某些操作。

解决方案非常简单:

  1. 创建页面副本。
  2. 切换您的网站以使用该副本。
  3. 修改无数其他网站嵌入的版本,以便有一个小链接返回给您。或者,添加将加载您网站的iframe拦截器脚本。
  4. 如果页面处于活动状态(即用户与其进行交互以找到缺失的螺栓),您可以在响应中添加一条销售消息,鼓励用户访问您的网站。

    我认为您的目标是让您在这些其他网站上的链接足够长,以便在进行嵌入的人注意之前被Google编入索引,这是一种平衡行为。

    我看到有关谷歌如何索引iframe的相互矛盾的建议。您应该使用PageRank检查器查看现有iframe页面网址是否具有PageRank,并将其与您嵌入它的网页进行比较。