我正在实施一个应用程序来创建将用纸质媒体打印的QR码。该应用程序是在Perl中,我成功生成代码。 (使用GD::Barcode::QRCode btw。铅管收紧......)
QR码将包含静态URL。目标扫描仪将是移动设备上的任何QR码阅读器。 “服务器”只是任何Web服务器。我的应用程序生成的代码包含指向服务器上可变目录的众所周知的类型文件(vCard或vCalendar)的链接:http://www.server.com/dir[XYZ]
。
由于要打印QR码,因此URL必须是静态的。
我了解X-Robots-Tag: no index
并放置了robot.txt文件。虽然这可能会阻止谷歌,但我不确定其他蜘蛛是否尊重这些标签。垃圾邮件发送者的蜘蛛我无法想象。
背景
此应用程序允许打印材料链接到Web上的动态元素。大多数QR阅读器(Android,i-nigma,QRReader等)都能正确处理vCard或vCalendar下载。虽然我可以直接将vCard或vCalendar的数据嵌入到QR代码中,但最好将文件放在Web服务器上,并在QR代码中包含该文件的URL。虽然文件不需要安全,但我宁愿他们不是垃圾邮件发送者的奶酪。
我知道如果有人输入http://www.myurl.com/random_string
,那么可以下载数据元素。这不是一个问题。我不想要用户确认或身份验证(除非这是客户端的行为。)只有在访问URL时要下载到Web客户端的目录中的文件,如果客户端知道如何处理它,则处理该文件。
问题
如果我的http://www.myserver.com/randomXYZ
在互联网上没有指向该网址的其他链接,那么蜘蛛如何找到它?我可以在静态URL中使用一些Javascript来执行此操作吗?有没有办法(我目前看不到)静态网址可以对蜘蛛和机器人有所抵抗?
答案 0 :(得分:0)
我不能肯定地说这将保证您的文件不会受到蜘蛛的影响,但我建议您查看以下网站,其中概述了目录权限的工作原理。
http://ag.arizona.edu/ecat/web/permissions.html
可以限制目录权限,以便可以通过服务器端请求访问文件,例如(php)include,require。
与任何网站一样,如果有人想从您的网站上获取某些内容并将足够的时间投入其中,他们就会得到它。
答案 1 :(得分:0)
您可以在链接中嵌入基本身份验证: