我现在正在编写一个网络爬虫,我想检测的一件事是使用AdWords的网站。
对于我来说,显而易见的方法是检查网站的html以获取Google AdWords跟踪代码段。
但是,Google Analytics(分析)现在还使用了Google标记管理器。
看看我在下面找到的代码...
分析代码
<!-- Global site tag (gtag.js) - Google Analytics -->
<script async src="https://www.googletagmanager.com/gtag/js?id=UA-XXXXXXX-2"></script>
<script>
window.dataLayer = window.dataLayer || [];
function gtag(){dataLayer.push(arguments);}
gtag('js', new Date());
gtag('config', 'UA-124430985-2');
</script>
使用PPC的网站上的标记管理器
<script>
(function(w, d, s, l, i) {
w[l] = w[l] || [];
w[l].push({
'gtm.start': new Date().getTime(),
event: 'gtm.js'
});
var f = d.getElementsByTagName(s)[0],
j = d.createElement(s),
dl = l != 'dataLayer' ? '&l=' + l : '';
j.async = true;
j.src = 'https://www.googletagmanager.com/gtm.js?id=' + i + dl;
f.parentNode.insertBefore(j, f);
})(window, document, 'script', 'dataLayer', 'GTM-XXXXXX');
</script>
可靠的技术仅仅是将“ googletagmanager.com”和“ dataLayer”字符串同时存在吗?
我对Google Analytics(分析)和AdWords生成的JS非常不熟悉,因此我不知道“ dataLayer”字符串是否会出现在Google Analytics(分析)js代码段中。