我们计划将内部网上的大量商业研究报告和文章放到互联网上。但是,我们不希望其他人复制内容并自行托管。
我读到了CAPTCHA的保护,并想知道这是否可行。读者应该能够免费阅读文章的50%,之后应该输入一个CAPTCHA来阅读文章的其余部分[这样我们就会让那些模仿者的生活变得更加困难]
关于如何实现这一点的任何指示?内容是在Perl,PHP中的HTML和编程经验。如果需要,可以雇用其他人。
另外,搜索引擎会抓取文章的一半,并想知道它是否会因为无法破解CAPTCHA而无法抓取文章的其余部分而惩罚网站?
感谢。
答案 0 :(得分:3)
Recaptcha提供了非常好的验证码服务 - http://recaptcha.net/
您可以使用一个PHP类来完成所有艰苦的工作。
重要的是要记住搜索引擎无法解决Captcha,所以他们只会索引报告的前半部分。只要这一半包含大部分正确的关键词,它就不会引起大问题。不要错误地“检测”搜索引擎并向普通用户显示不同的内容,因为主要搜索引擎认为这是垃圾邮件。
另一种解决方案是使用像Copyscape(http://www.copyscape.com/)这样的服务来保护您的内容。
答案 1 :(得分:1)
我知道这不是您所要求的,但请注意CAPTCHA普遍被破坏,并且不会保护您的内容。你说上半场是免费的,这是否意味着你打算为另一半收费? CAPTCHA根本不会帮助你......
但即使你只是想阻止自动抓取,CAPTCHA仍然不会做到这一点。查看my answer to another captcha question ...或者您可以去年the ppt I presented直接访问OWASP。
答案 2 :(得分:0)
读者应该可以免费阅读文章的50%,然后输入验证码以阅读文章的其余部分
让您的PHP程序员输出文章的50%。在底部,添加验证码。如果用户输入正确的验证码,则输出100%的文章。
关于如何实现这一点的任何指示?内容是在Perl,PHP中的HTML和编程经验。如果需要,可以雇用其他人。
作为PHP程序员,我使用http://www.phpcaptcha.org来实现验证码。
另外,搜索引擎会抓取文章的一半,并想知道它是否会因为无法破解CAPTCHA而无法抓取文章的其余部分而惩罚网站?
不,它不会惩罚您,但搜索结果中不会显示该特定部分。
答案 3 :(得分:0)
如上所述reCAPTCHA是一个很好的方法。
,查看CPAN rating上的"Works out of the box"如果你想要Captcha,那么CPAN上有plenty of modules that do this; - )
希望有所帮助。