使用favicon跟踪用户对网站的访问

时间:2013-05-30 05:41:20

标签: php jquery cookies favicon visited

我在this answer to "How website can track users even after clearing browser cookies"中读到可以通过网站favicon跟踪用户:

  

Favicons是第三种可能性 - 大多数浏览器之前都要求   页面已加载,因此如果满足该请求,则客户端   显然是一个重复的访客。

如果这实际上是可行的,那么它可以是检查用户之前是否访问过该网站的好方法,不需要为该porpouse使用cookie。

我不确定这是否可以用PHP或Javascript(jQuery)完成。 如何实现这一目标?

修改

我对此的解释是,如果用户需要Favicon,他就会拨打电话。如果他没有打那个电话,那就意味着他已经有了这个电子邮件,所以他去了。因此,无需在用户计算机中存储任何文件(例如cookie)或将其IP保留在服务器中。这是对的吗?

7 个答案:

答案 0 :(得分:15)

您需要做两件事。首先,您需要将favicon请求重定向到脚本。你可以用两种方式做到这一点。第一种方法是在.htaccess文件中添加以下内容

RewriteEngine on
RewriteRule ^/favicon.ico   /favicon.php  [L]

或者你可以在html代码中发送另一个favicon位置。但是,我不会使用它直接重定向到php脚本,因为如果某些浏览器不是真正的.ico.png文件,则会正确使用它。也许您可以将其用于重定向到其他favicon.ico位置,并将其与.htaccess结合使用。我为所有设置使用了一个图标位置,这不是真正需要的。但是这样你就知道如何改变它。

<link rel="icon" href="/favicon.ico" type="image/x-icon">
<link rel="shortcut icon" href="/favicon.ico" type="image/x-icon">
<link rel="icon" href="/favicon.ico" type="image/x-icon" sizes="32x32">
<link rel="shortcut icon" href="/favicon.ico" type="image/x-icon" sizes="32x32">

由于您要重定向到PHP脚本,您可以使用以下代码来处理实际请求。

<?php
//the location of the actual favicon
$favicon = '/favicon.ico';
$protocol = (isset($_SERVER['SERVER_PROTOCOL'])) ? $_SERVER['SERVER_PROTOCOL'] : 'HTTP/1.0';

//try to get the file info, to be able to get the correct content type
//if it doesnt work, return 404 error
$size = @getimagesize($favicon);
if (!$size) {
  header($protocol . ' 404 Not Found');
  exit();
}

// Content type
header('Content-type: ' . $size[2]);

//when is the icon last modified
//Keep in mind that if you modify the icon, all returning visitors will be handled as new visitors
$last_modified_time = @filemtime($favicon);

header("Accept-Ranges:  bytes");
//set a long max-age with a recheck marker, so people check if the icon is still the same and thus access this script.
header("Cache-Control: max-age=15724800, public, must-revalidate");
header("Vary: Accept-Encoding");
//some say the Etag is bad, some say it isnt. You can remove this part if you dont want to use it.
header("Etag: " . md5($favicon . $last_modified_time));


// exit if not modified
if (array_key_exists('HTTP_IF_MODIFIED_SINCE', $_SERVER)) {
  if (@strtotime($_SERVER['HTTP_IF_MODIFIED_SINCE']) == $last_modified_time) { 
      header($protocol .' 304 Not Modified'); 

      /*
      At this point you have a returning visitor.           
      */
      DoSomethingWithReturningVisitor();

      exit();
  }
}

// exit if not modified using Etag, remove it if you dont want to use it.
if (array_key_exists('HTTP_IF_NONE_MATCH', $_SERVER)) {
  if ($_SERVER['HTTP_IF_NONE_MATCH'] == md5($favicon . $last_modified_time)) { 
      header($protocol.' 304 Not Modified'); 


      /*
      At this point you have a returning visitor.           
      */
      DoSomethingWithReturningVisitor();


      exit();
  }
}

//you are sending a new image to the user. Add the last modified time.
header("Last-Modified: ".gmdate("D, d M Y H:i:s", $last_modified_time)." GMT");


//log that he is a new visitor
//If you dont to this, the user will be marked as returning visitor when he visits the 2nd page of your website
$_SESSION['newVisitor'] = true;

//return the content of the actual image
echo file_get_contents($favicon);


//A single point to handle returning visitors
//make sure you dont have any output in this function, because you are still returning a valid favicon. If you have any output the returned icon will be corrupted.

function DoSomethingWithReturningVisitor() {
  if (!empty($_SESSION['newVisitor']) && $_SESSION['newVisitor'] === true) {
    //already marked as new visitor, so skip for this session
    return;
  }

  //do something to give this user special treatment
  $_SESSION['returningVisitor'] = true;
}
?>

现在,在第一次请求您的网页时,很难跟踪。因为首先会向您的主页发出请求,然后会尝试加载favicon.ico。所以新的/回访者的信息不能直接在php中获得。检查主页顶部的回访者是否类似

的最佳方法
<?php
if (empty($_SESSION['returningVisitor']) && empty($_SESSION['newVisitor'])) {
   //unknown if user is new or not
} else if (!empty($_SESSION['returningVisitor']) && $_SESSION['returningVisitor']===true) {
   //returning visitor
} else {
   //new visitor
}
?>

如果您真的需要在主页上知道它(或者用户请求作为此会话的第一页的任何其他页面),您最好选择在加载文档时进行ajax调用,甚至可能是短暂的超时,因为favicon.ico请求并不总是身体的一部分。

答案 1 :(得分:6)

要获取有关Apache中的favicon请求的信息,请编辑.htaccess文件以将favicon请求重新路由到您选择的脚本。然后,您需要记录请求IP地址或使用cookie来确定网站访问者是否刚刚请求了图标。

修改
请记住在处理请求后返回favicon。

答案 2 :(得分:2)

  

我不确定这是否可以用PHP或Javascript(jQuery)完成。如何实现这一目标?

您可能想了解客户端和服务器端编程的差异。

在您的情况下,您从服务器的角度来看,因此您希望利用服务器端功能(可能还有编程)。因此,可以使用服务器端的服务器实现此非cookie的favicon HTTP请求跟踪。您的服务器知道何时请求了favicon,只需记录请求并解释数据。

  

我对此的解释是,如果用户需要Favicon,他就会拨打电话。如果他没有打那个电话,那就意味着他已经有了这个电子邮件,所以他去了。

确切地说,但您也应该在某些情况下对此进行测试。例如。浏览器可能会考虑也可能不考虑HTTP caching。因此,要了解规范,了解规范,根据这些规范实现对数据的解释,并使用不同的浏览器和计算机进行现场测试。

  

因此无需在用户计算机中存储任何文件(例如cookie)或将其IP保留在服务器中。这是对的吗?

嗯,如果你想解释它,你需要存储至少一些东西。它不一定是技术上的文件(例如,您也可以存储到共享内存中),但是,您需要使用一些数据,这通常需要存储它(某处)。

答案 3 :(得分:1)

当浏览器从您的服务器请求任何内容时,它会发送所有cookie等。对于favicon也是如此。

要让PHP“拦截”这些请求,您需要强制Apache(或者您正在使用的HTTP服务器)将favicon视为php文件。

在.htaccess类型中(再次假设为apache)

<FilesMatch "^favicon.ico$"> 
ForceType application/x-httpd-php
SetHandler application/x-httpd-php
</FilesMatch>

现在,对于favicon,服务器现在正在期待一个php文件,而客户端正在期待一个图标。所以在php之外根本没有空白区域,或者图标不起作用。首先将您的真实favicon移动到real-favicon.ico,然后使用以下

创建一个新的favicon.ico
<?php
//do any processing you wish here, all cookies etc are available if needed 

header('Content-type: image/x-icon');
echo file_get_contents ("real-favicon.ico");

你不需要最后一个?&gt;所以它可能更安全,因为一些编辑在底部放置了空白区域,这将破坏图像。

如果没有这种方法,你必须解析apache日志,寻找这些和匹配的IP。

您仍然需要Cookie信息,没有它就无法传递/跟踪信息。

答案 4 :(得分:0)

您可以使用基于Web服务器的重定向/重写将favicon请求传递给您选择的服务器端语言。实现取决于您的网络服务器和语言的风格。但是如果您要让脚本直接处理这个,那么您也可以从页面进行跟踪。

或者,如果您不需要实时信息,可以尝试读取日志文件。如果他们这样做,您可能会获得更可靠的结果跟踪robots.txt。此外,根据您的网络服务器,日志可能不包含您需要的所有信息(时间戳,IP等)。

但是,我强烈建议不要使用favicons。对于何时请求favicon并且浏览器以不同方式处理这一点,没有明确的规则。他们可以在不访问网站的情况下请求favicon(只是为了更新书签),或者他们可以定期请求。请求favicons不仅限于浏览器;许多Web应用程序使用favicons显示在链接旁边。所有这些意外的命中都可能使统计数据非常不可靠。

答案 5 :(得分:0)

您提到的答案并未解释该技术。

通过为每个用户提供一个唯一的favicon网址,使用favicons识别用户的技巧。

此外,favicon提供的标题需要浏览器重新验证它。

当用户浏览器重新验证favicon时,它的唯一名称将被传递,并且例如可以禁止IP地址。

答案 6 :(得分:-3)

要么使用“cookie”,这不是很好的跟踪不同的浏览器或使用PHP来跟踪IP地址。