什么是保护链接数据库免受自动刮刀影响的好方法?

时间:2009-09-01 17:36:49

标签: screen-scraping data-protection

我有一个大型链接数据库,我想要保护其他人不想复制它们。除了强迫人们在每个链接之前输入CAPTCHA之外,还有什么可以做的吗?

2 个答案:

答案 0 :(得分:2)

您可以使用ROT13输出链接,然后使用javascript将它们恢复正常。 这样,刮刀必须支持javascript才能窃取您的链接,这应该减少符合条件的刮刀的数量

奖励积分:用更难的东西取代ROT13,并混淆你的'解码'javascript。

答案 1 :(得分:1)

javascript建议可行,但是对于那些使用辅助技术(如屏幕阅读器)以及任何没有javascript的人来说,您都无法访问您的页面。

另一种可能的选择是生成cryptographic nonce。此技术目前用于防止CSRF攻击,但也可用于确保在访问链接之前,刮刀必须从您的站点请求页面。如果您支持热链接,这种方法可能不合适,但如果您只是想确保某人首先访问您的网站,则可能会有效。

另一个有点贫民窟的选择是使用推荐人。这些可以很容易伪造,但它可能会阻止一些笨重的刮刀。这还要求您知道用户在访问您的网站之前从哪里来。

如果您是热链接或用户是否在访问受保护链接之前访问您的网站,您能告诉我们吗?我们或许可以通过这种方式提供更好的建议。