app:/EncycloPDF.swf - 谁/它是什么?

时间:2011-01-31 05:24:47

标签: web-crawler bots statistics

尝试对统计日志进行一些侦探工作。 43%的点击来自推荐人app:/EncycloPDF.swf

典型的日志条目是178.146.205.174 - - [29 / Jan / 2011:23:50:37 -0800]“GET /filename.pdf HTTP / 1.1”200 86571“app:/EncycloPDF.swf”“Mozilla /5.0(Windows; U; en-US)AppleWebKit / 531.9(KHTML,如Gecko)AdobeAIR / 2.5.1“

这个恰好是googlebot crawl-66-249-67-204.googlebot.com,但它们来自世界各地。

真正的问题是某人是否正在为某种应用程序挖掘内容。

在任何地方找不到任何对EncycloPDF.swf的引用,但我敢打赌这里有人知道答案。

提前致谢

2 个答案:

答案 0 :(得分:0)

我承认这不是我有很多经验的领域,所以我可能完全错了,但可能是第三方网站上的Flash内容提出了请求。

发出请求的主机也可能安装了应用程序或浏览器扩展程序(EncycloPDF?),它添加到浏览器的User-Agent值,以与Windows Media Center,.NET相同的方式向服务器宣布它的存在框架和Silverlight在Windows上执行

答案 1 :(得分:0)

对于几周后的价值,这是答案。有人写过并且正在销售一个应用程序 窃取,使用网站上的PDF文件,并通过应用程序将它们包含在实时视图中。

这是在购买该应用程序的人之后曝光的,但也喜欢该网站提供的免费PDF文件,注意到发生了什么并报告了它。

对.htaccess文件进行一点编辑,现在他们加载的每个歌曲文件......好吧,他们都被重定向到一个PDF文件,上面写着“抱歉,这些材料未经许可使用。你可以免费获得......“