确定网站上的某个网页是否真的显示特定的img标记(如<img src=http://domain.com/img.jpg>
)的最佳方式是什么?使用http评论<!-- -->
很容易搞砸简单的字符串比较。即使html标记存在,也可以使用JavaScript删除它。使用CSS在其上放置图像也可能会使其模糊不清。你知道一种可靠的方法来检测这些模糊攻击列出的img标签争议吗?你知道另一种模糊图像的方法吗?用于检测图像的Python代码将是理想的,但如果你知道一个好的策略或方法将从我那里获得+1。
答案 0 :(得分:1)
我能想到的唯一可靠方法是渲染页面并进行检查。剥离注释等很简单。但是如果涉及脚本,则不可能有一个通用的解决方案,而不是执行它们(我相信这是我第一次调用Church's theorem ...)
答案 1 :(得分:1)
我认为你无法确定。首先,您甚至不确定该计划是stop
除此之外,请考虑以下方案。您可以使用JavaScript,CSS和/或服务器端添加,删除或隐藏<img>
:
Google面临着类似的问题 - 人们隐藏了隐藏文字和链接中的搜索关键字以获得更好的排名。他们的解决方案是penalize sites with hidden text。他们逃脱了,因为他们是谷歌;人们依靠他们来进行交通 至于你,你做得好不过比问好......
答案 2 :(得分:0)
您可以将脚本放在处理请求的任何位置,对视图进行计数并按如下方式传递图像:
http://yourhost.com/imageprocess?image=media/foo/bar.jpg
然后您可以确定图像已加载。如果被查看过,那么你当然不能确定。