如何知道用户是否使用其网络流量点击了链接

时间:2017-05-18 06:47:53

标签: http http-headers traffic network-traffic web-traffic

我有大量的流量文件,我试图分析,以获得用户的统计功能 我想要提取的功能之一是点击特定网站的链接(例如 - 点击弹出窗口等)

我的第一个想法是查看数据包的内容并搜索hrefs和链接,将它们全部保存在带有时间戳的某种数据结构中,然后再次遍历数据包以搜索请求在接近链接出现的任何时间。

类似于以下伪代码(在以下代码中,数据包按流分类(流程:IP1< => IP2)):

for each packet in each flow:
      search for "href" or "http://" or "https://"
      save the links with their timestamp
for each packet in each flow:
      if it's an HTTP request and its URL matches any URL in the list and the 
         time is close enough, record it

此代码的问题是在页面加载时会动态生成某些链接(使用javascript等),并且无法使用上述方法找到。

我还尝试检查HTTP标头中的referrer字段,并查找相关网站引用的数据包。由于iframe和嵌入对象,此方法会产生大量误报。

重要的是要提到这不是我的服务器,我的目的是制作一个用户行为统计分析工具(因此,我无法在我的网站上添加某种点击跟踪器)。

有谁知道我该怎么做才能检查用户是否根据他们的网络流量点击了链接? 任何帮助将不胜感激!
谢谢

0 个答案:

没有答案