如何防止抓取工具跟踪链接?

时间:2011-02-12 22:59:06

标签: html seo bots googlebot

我正在建立一个允许卖家的网站:

  • 在我的网站上列出他们的产品
  • 将每个产品链接返回卖家的网站
  • 对每个点击的链接收取费用

我现在需要做的是以某种方式确保我只是在链接到卖家网站后记录真实的人类用户。如果它是一个机器人爬行网站,我不应该向卖家收取费用。

有没有办法告诉机器人不要关注某个链接?我不认为它是nofollow,因为它不是为了阻止对内容的访问。

3 个答案:

答案 0 :(得分:5)

告诉机器人不要关注链接的方法正是将rel = nofollow添加到你的< a>标签。 假设您在转发到外部URL之前也在本地登录,您还可以检查用户代理字符串。

事实上,如果您要根据推荐人数要求人们付费,那么在您的统计数据受到质疑的情况下,根据每次付费点击记录IP地址和用户代理可能是一个想法。

答案 1 :(得分:3)

您只需添加[ robots.txt ]文件,例如比如this one

您可以在网上找到有关[robots.txt]文件的更多信息,例如in Wikipedia

干杯&第h。,

答案 2 :(得分:0)

通常,您可以通过用户代理字符串识别它们。你可以在这里找到一个列表,不能说它是完美的,但它是一个很好的扩展基础:PHP/MySQL - an array filter for bots

Robots.txt是另一种方式,more about it here